Mina Choi
bed5f0c274
chore: TIKTOK_ACTOR 상수 + 수집기 옵저버빌리티 정리
...
apify.py: 라이브 actor id 들을 모두 모듈 상단 상수로 통일 (TIKTOK_ACTOR 추가).
fetch_tiktok_profile 이 raw 문자열 'clockworks~tiktok-scraper' 쓰던 것 정리.
이제 IG_PROFILE / IG_HIGHLIGHTS / FB_PAGES / FB_POSTS / TIKTOK 5개 상수.
수집기 옵저버빌리티 정리:
- collect.py: 채널별 done 로그에 붙이던 _summarize (followers/posts 등 데이터
shape inspection) 제거 — production 로그가 아니라 진단용에 가까워 test_raw.py
의 summarize() 로 대신 충분.
- enrichment.py / pipeline.py / collect.py: 저레벨 수집기의 timing instrumentation
은 정리. orchestrator 레벨(pipeline 의 stage_times, analysis/market 의 LLM
호출 timing)은 유지.
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-29 10:45:23 +09:00
Mina Choi
652265cd19
페북 수집·지표·저장 파이프라인 정리
...
수집:
- pages + posts 두 actor 병렬 호출 (facebook-pages-scraper, facebook-posts-scraper)
- 저장 필드 슬림화: 페이지 메타에서 likes/rating/email/phone/address 제거
(followers/reviews와 중복이거나 클리닉 raw_data에 이미 있음)
- 게시물 저장은 캡션 160자 + likes/reactions/shares/views/isVideo/timestamp만
지표 계산 위치 이동: 리포트 시점 → 수집 시점:
- recent_post_age / post_frequency / engagement 를 transform_for_storage에서
결정적으로 산출해 DB에 박음 (재계산 불필요)
- 저장된 게시물은 LLM용 캡션·타입 2필드만 — 추가 슬림 단계 제거
리팩토링:
- services/facebook_audit.py 신설 (instagram_audit 패턴) — _build_overrides의
인라인 클로저(_fb_page_patch)와 analysis.py의 _fb_post_metrics 분리
- collect.py / enrichment.py 가 transform_for_storage를 호출하도록
엔게이지먼트 표기:
- 범위(min~max)로 표시, 전부 0인 지표는 제외
- 댓글은 actor 미제공이라 "댓글 거의 없음" 고정 부가
콘텐츠 유형:
- top_content_type 은 캡션 본문 주제 추론이 필요해 LLM에 위임
- report_prompt.txt 에 facebook_audit.pages[].top_content_type 작성 지침 추가
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-28 13:49:22 +09:00
Mina Choi
4f756cf001
인스타 highlights/계정 수집 개선 (VIEW actor + 코드로 계정 구성)
...
- apify: 프로필 coderx, 하이라이트 igview actor로 교체. highlights/category/
following(followsCount)/profileImage(hdProfilePicUrl)/latestPosts.mediaType 수집.
reel 스크래퍼 제거, post 스크래퍼 비활성화(주석)
- instagram_audit.py(신규): KR·EN 계정 hard 필드를 수집 데이터로 구성
- analysis: _build_overrides에서 위 함수로 계정 구성, _patch_report가 accounts를
코드값으로 주입 (LLM은 diagnosis만, 프롬프트에서 accounts는 []로 두게 지시)
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-28 09:43:03 +09:00
Mina Choi
9817b53be1
틱톡·영문 인스타/페북 채널 수집 추가
...
- apify: 틱톡 프로필 액터
- mock_urls.py: 클리닉별 채널 URL 매핑 (mockUrls.json → 파이썬 모듈)
- api/analysis: homepage 매칭으로 미지원 채널 보충 (추후 DB)
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-27 13:27:39 +09:00
jaehwang
cb798f7acc
instagram externalurl 수집 비활성화 (LLM이 혼동을 일으킴)
2026-05-20 18:36:29 +09:00
jaehwang
1f45b3e53d
fix 유튜브 채널 수집 실패 버그
2026-05-20 10:00:39 +09:00
jaehwang
2b8a90e857
llm 붙임 및 리포트 생성 확인
2026-05-14 16:16:09 +09:00
jaehwang
d930679e90
integration 1차 데이터 및 DB 정의, 테스트
2026-04-24 14:19:29 +09:00