o2o-infinith-backend

Commit Graph

Author	SHA1	Message	Date
jaehwang	a282bb3b29	add autoproxy for firecrwal	2026-06-18 11:36:25 +09:00
jaehwang	638b83ea18	firecrawl 타임아웃 상승	2026-06-18 11:27:52 +09:00
jaehwang	387aa758d0	plan 인풋 summary 추가 및 firecrawl 캐싱 삭제	2026-06-18 10:19:44 +09:00
jaehwang	687b2c0bfd	도커 컴포즈 파일 템플릿화	2026-06-18 09:17:12 +09:00
Mina Choi	a4fbf60d42	도커 외부 네트워크 연결 추가(프론트랑 공유)	2026-06-09 10:45:55 +09:00
jaehwang	5ff1d68a27	유튜브 업로드 주기 계산 로직 추가	2026-06-08 13:58:07 +09:00
Mina Choi	c0fa48ff75	fix(kpi_dashboard): facebook/instagram None kpi 필터링 followers=0 일 때 _follower_kpi 가 None 반환하는데 fb/ig 만 필터링 없이 kpis 리스트에 그대로 들어가서 KPIMetric pydantic 검증에서 stuck. 다른 채널 (YT/TikTok 등) 처럼 if k 필터링 추가. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-05 09:27:41 +09:00
Mina Choi	c4cbbaf7e7	website_audit 추출 정확도 개선 + Apify 빈값 방어 - website_parser: anchor-only href 추출로 CDN 노이즈 차단, additional_domains 를 data-lang/서브도메인 prefix 기반 글로벌 사이트 검출로 교체, main_cta 카테고리화 (전화/카톡/예약, fallback 제거) + 최대 3개 제한 - firecrawl: html → rawHtml 로 변경 (script 태그 보존 → 픽셀 검출 정상화) - gemini_vision: logo_colors_hex 최대 5개 → 2개 - branding: 기존 brandAssets 보존하면서 logo_* 머지 (collect_brand_basics 결과 덮어쓰지 않게) - facebook_audit: _page_patch 가 누락 필드 default 값으로 초기화 (Apify 가 페이지 데이터 못 받을 때 schema validation 실패 방어) - schemas: top_videos / bio / linked_domain 옵셔널 처리 (실제 누락 가능 케이스 대응) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-04 22:43:40 +09:00
jaehwang	4ad30d4d36	fix logo description	2026-06-04 17:21:50 +09:00
jaehwang	5baea01ae1	데이터 출력 확인	2026-06-04 16:50:34 +09:00
jaehwang	9919529a88	merge all items	2026-06-04 14:56:12 +09:00
Mina Choi	f949a23717	website audit, other channels 분리 추가	2026-06-04 14:49:26 +09:00
jaehwang	ff19db34a8	빈값 채우기 및 코드 정리	2026-06-04 14:47:01 +09:00
Mina Choi	5504f79a9d	refactor(report): build_overrides + patch_report 통합 / list wholesale merge - _build_overrides 가 result 받아 deep_merge 까지 처리, _patch_report 제거 - _deep_merge: list by-index → wholesale 치환 (EN 슬롯 누락/라벨 섞임 차단) - build_facebook_audit: template-copy 대신 LLM logo/logo_description 만 두 페이지에 공통 적용 - _page_patch: language/label 명시 박음 (KR/EN 교차 오염 방지) - FacebookPage/InstagramAccount/YouTubeAudit: 불필요한 Optional 제거, has_whatsapp/top_content_type 만 Optional 유지 - build_instagram_audit/build_facebook_audit: dict 반환 (overrides[k] = patch 단순 박기)	2026-06-02 17:04:33 +09:00
jaehwang	45a74ab970	roadmap 섹션 정보 출력	2026-06-02 16:34:18 +09:00
jaehwang	2232273200	transformation 섹션 정보 출력	2026-06-02 16:21:19 +09:00
jaehwang	484ee41810	critical_issues 섹션 정보 출력	2026-06-02 15:31:06 +09:00
Mina Choi	9a9ce1319f	fix(branding): logo URL 컬럼 일관성 + 잘못된 로고 묘사 회피 - 채널 collectors (instagram/facebook/youtube/tiktok) 가 profileImage 를 raw_info.logo_url 컬럼에도 저장 - collect_brand_basics 가 공식 로고 URL 을 branding row 가 아니라 mainpage row 의 logo_url 컬럼에 저장 - select_branding_logo_url 가 mainpage row 의 logo_url 조회하도록 SQL 수정 - select_run_raw_data 가 logo_url 컬럼도 반환 (_logo_url 합성키) → branding._describe_channel_logos 가 컬럼에서 통일된 이름으로 읽음 - _describe_logo candidates 에서 firecrawl ogImage 제거 (이벤트 배너 잘못 잡히던 케이스) - extra_channels (tiktok/kakaotalk/naver_cafe) language='KR' 박음 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-02 13:12:58 +09:00
jaehwang	35e5e98524	add brand consistency generation	2026-06-02 11:29:31 +09:00
Mina Choi	af61713697	refactor(branding): collect/report 단계 분리 + Vision logo hex 추가 - integrations/color_extractor → integrations/site_fetcher (HTTP) + services/brand_parser (파싱) 분리 - integrations/vision → integrations/llm/gemini_vision 이동 - services/collect_extras → services/collect.collect_brand_basics (collect) + services/branding (report) 분리 - Vision prompt 에 logo_colors_hex 5개 강제 + 길이 fallback (4·6개 들어와도 5개로 정규화) - branding 단계: HTML parser canonical logo URL 을 Vision 에 1순위 전달 → firecrawl 가 잘못된 이미지 (마케팅 배너 등) 를 logo 로 잡는 케이스 회피 - select_run 에서 큰 JSON 컬럼 (report_data/plan_data) 빼서 meta only → generate_plan 만 select_run_report_data 별도 조회. 4군데 호출자는 가벼워짐 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-02 11:08:38 +09:00
Mina Choi	b844951ad8	refactor(branding): logo URL 을 raw_info.logo_url 컬럼으로 분리 - collect_brand_assets: Vision 결과의 logo_images 를 JSON 에서 제거하고 진짜 로고(logo/og 매칭) 인 경우만 raw_info.logo_url 컬럼에 저장. favicon-only 매칭은 컬럼 저장 X (옛 logic 동일). - analysis._build_overrides: select_branding_logo_url 로 컬럼 읽어 ClinicSnapshot.logo_images 를 horizontal=logo_url 로 재구성. - branding raw_data 가 "사실 데이터(URL/hex)" vs "Vision 분석 텍스트(묘사)" 섞이던 문제 일부 해소 — URL 은 컬럼, 텍스트만 JSON 에 잔존. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-01 17:01:19 +09:00
Mina Choi	009d95377a	Merge 'b6a0134 db 스키마 변경' on top of db-migration Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-01 16:57:12 +09:00
Mina Choi	c23e620fb4	Merge branch 'db-migration': remote_source + raw_info 통합 스키마 - common/db.py 단일 파일 → common/db/ 패키지로 분리 (hospital/source/run/market/file_data) - 모든 채널 데이터를 raw_info 단일 테이블로 통일 (hospital_baseinfo.raw_data / 채널별 *_data 테이블 제거) - 부가 채널(tiktok/instagram_en/facebook_en/kakaotalk/naver_cafe)도 remote_source+raw_info 로 일원화 - EN 채널은 같은 source_type + language='EN' 으로 구분, select_run_raw_data 가 합성키로 반환 - SourceType.BRANDING 추가 — brand_assets/channel_logos 결과를 하나의 raw_info entry 에 머지 - collect.collect_all: main wave gather → branding 2단계 순차 실행 - mock_urls 매칭 + _with_scheme 보정 유지 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-01 16:57:08 +09:00
jaehwang	b6a0134ba7	db 스키마 변경	2026-06-01 16:51:30 +09:00
Mina Choi	86af23b56d	feat(kpi): 규모별 성장률 공식으로 KPI dashboard 코드 산출 Perplexity Sonar가 KPI target schema 필드를 구조적으로 못 채우는 한계 검증됨 (프롬프트 강화·sonar-pro·sonar-reasoning-pro·hint 주입 다 실패). mockup 7개(irum/grand/o2o/ts/banobagi/wonjin/viewclinic) 역분석으로 추출한 채널 규모별 성장률 공식을 코드에서 결정적으로 산출 → 100% 재현성 확보. - kpi_dashboard.py(신규): _target_multiplier 4단계 + _blog_frequency cadence + 강남언니 리뷰 보수적 multiplier - 8 metric 산출: YouTube 구독자 / Instagram KR·EN 팔로워 / Facebook KR·EN 팔로워 / TikTok 팔로워 / Naver Cafe 회원 / 네이버 블로그 포스팅 빈도 / 강남언니 리뷰 - analysis.py: _build_overrides에서 build_kpi_dashboard 호출, _patch_report에서 LLM 출력 무시하고 코드값 강제 - common/utils.parse_ts: facebook_audit._parse_ts 옮겨 공용화 (FB·블로그 RSS 둘 다 사용). ISO 8601 / epoch / RFC 2822(네이버 RSS) 통합 처리 - report_prompt: kpi_dashboard는 코드 강제 치환 안내 + overall_score는 channel_scores 평균으로 0/null 금지 가드 추가 mockup viewclinic YT 구독자 104K→115K→200K 정확 일치 검증. 라이프사이클 4단계로 같은 raw_data 입력 시 매번 동일 output 보장. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-01 15:45:06 +09:00
jaehwang	3b4c154fb2	db migration done	2026-06-01 15:31:33 +09:00
Mina Choi	e5a9036e47	fix(report+analysis): Instagram/Facebook Optional 완화 + viewclinic mock 제거 + brand_assets 강제주입 - schemas/report.py: InstagramAccount/InstagramAudit/FacebookPage/FacebookAudit 필드 Optional 완화 (LLM이 page 1·2개 모두 language/label/logo/has_whatsapp 등 빼먹는 케이스 차단) - analysis.py: viewclinic mock 분기(_is_mock, _load_mock_report, _load_mock_plan) 제거 — raw_data 충분 - analysis.py: _build_clinic_snapshot에 brandAssets.logo_images/brand_colors 강제 주입 (LLM 프롬프트 가드 무시하고 null 두는 케이스 차단) - analysis.py: facebook_audit.pages 머지 방식 변경 — LLM 첫 페이지 템플릿 복제 후 코드 patch로 인덱스별 덮어쓰기 (EN(index 1) 드랍 + label/logo 누락 검증 실패 동시 회피) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-06-01 08:50:35 +09:00
Mina Choi	5dbc7d7ffe	fix(report): ClinicSnapshot/YouTubeAudit/Instagram/Facebook Optional 완화 required로 두면 LLM 응답이나 수집 데이터 누락 시 pydantic ValidationError로 리포트 endpoint 전체가 500으로 죽음. 실제 테스트(청담오라클)에서 LLM이 weekly_view_growth, established 등 10개 필드를 null 반환하는 케이스 확인. - ClinicSnapshot/YouTubeAudit: schemas + models 양쪽 모두 Optional (LLM 입력 검증 + FastAPI 응답 검증 둘 다 통과 필요) - InstagramAccount/InstagramAudit/FacebookPage/FacebookAudit: models만 (인스타·페북 빈 계정/페이지 케이스 대응) - list[T] 필드는 기본값 [] 부여 트레이드오프: 스키마 레벨 데이터 완결성 보장 약화. 운영하며 자주 비는 필드 패턴 보고 collection 단계 보강 필요. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 16:42:04 +09:00
Mina Choi	71b605eaa6	Merge branch 'wip/channel-brand-2026-05-29' 채널 확장 + 브랜드 자산 파이프라인을 main에 통합. 신규/주요 변경: - 5채널 외 부가 수집 (틱톡/IG·FB 영문/네이버 카페/카카오톡) — collect_extras.py - 브랜드 자산: 홈페이지 로고 URL + CSS 색상 추출 (color_extractor.py) + Gemini Vision 로고 묘사 (vision.py) - 채널 로고 비교: 공식 로고와 각 채널 프로필 이미지 일치 여부 평가 - 인스타/페북 audit 빌더 분리 (instagram_audit.py, facebook_audit.py) - mock_urls.py: 78개 병원 영문 채널 51건 + 필드 캐노니컬 순서 정규화 - ReportInput/PlanInput 신규 채널 필드 추가 - ChannelBrandingRule literal "missing" → "N/A" teammate eed5772와의 conflict 해결: - ClinicSnapshot/YouTubeAudit: teammate가 신뢰 못하는 필드 제거 (established/years_in_business/price_range/media_appearances/medical_tourism/nearest_station/subscriber_rank) - services/analysis.py: teammate의 _build_clinic_snapshot/_build_youtube_audit/duration helpers + 우리의 _naver_blog_summary 둘 다 보존 - imports: youtube_diagnosis_prompt + build_instagram_accounts/build_facebook_pages 모두 채택 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 16:40:21 +09:00
jaehwang	c9c5ee9177	Merge branch 'main' into db-migration	2026-05-29 16:31:47 +09:00
Mina Choi	aff2b2720d	WIP: channel-brand merge + Optional 모델 완화 + collect_extras rename + mock_urls 영문 채널 51건 머지 본체: - 5채널 외 부가 수집(틱톡/IG·FB EN/네이버 카페/카카오톡) - 브랜드 자산/채널 로고 Vision 분석 - ReportInput/PlanInput에 신규 채널 필드 추가 - ChannelBrandingRule literal "missing" → "N/A" 후속 로컬 작업 (분리 커밋 예정): - fix(report): ClinicSnapshot/YouTubeAudit/Instagram/Facebook required→Optional (LLM null 응답 대응) - refactor: enrichment.py → collect_extras.py (네이밍 명확화) - data(mock_urls): 38개 병원 영문 채널 51건 추가 + 78개 필드 캐노니컬 순서 정규화 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 16:22:17 +09:00
jaehwang	eed57729d9	clinic_overview , youtube analysis 정리	2026-05-29 16:19:06 +09:00
Mina Choi	56fa2c6238	chore: schema/model 잔여 sync (이전 커밋에 빠진 스키마 필드) - ReportInput / Channels: kakao_talk, naver_cafe 필드 (이전 카카오/카페 채널 커밋 092bfe7 에서 누락) - PlanInput: naver_blog 필드 (이번 네이버 블로그 채널 커밋 `9da285e` 에서 누락) - ChannelBrandingRule literal: "missing" → "N/A" 통일 (이전 missing→N/A 커밋 5f1eee8 에서 누락) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:46:15 +09:00
Mina Choi	4bc7c9652c	data(mock_urls): 카카오톡·네이버 카페 URL 일괄 추가 + 필드 정렬 78개 클리닉에 kakaoTalk / naverCafe 필드 추가, 검색 agent 가 일괄 조회한 결과 적용: - kakaoTalk: 68개 (한국 클리닉 87% 가 카카오톡 채널 운영 — pf.kakao.com/_X 형태) - naverCafe: 3개 (의료 클리닉 공식 카페 운영은 드물어 적음) URL 형식 정규화: https://, www. 접두사 제거하고 호스트부터 시작. 확실하지 않은 케이스는 agent 가 의도적으로 빈값으로 둠 (개인 카톡 친구 추가 링크나 오픈채팅, 동명 다른 병원 카페 같이 false positive 위험 있는 케이스). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:45:36 +09:00
Mina Choi	bed5f0c274	chore: TIKTOK_ACTOR 상수 + 수집기 옵저버빌리티 정리 apify.py: 라이브 actor id 들을 모두 모듈 상단 상수로 통일 (TIKTOK_ACTOR 추가). fetch_tiktok_profile 이 raw 문자열 'clockworks~tiktok-scraper' 쓰던 것 정리. 이제 IG_PROFILE / IG_HIGHLIGHTS / FB_PAGES / FB_POSTS / TIKTOK 5개 상수. 수집기 옵저버빌리티 정리: - collect.py: 채널별 done 로그에 붙이던 _summarize (followers/posts 등 데이터 shape inspection) 제거 — production 로그가 아니라 진단용에 가까워 test_raw.py 의 summarize() 로 대신 충분. - enrichment.py / pipeline.py / collect.py: 저레벨 수집기의 timing instrumentation 은 정리. orchestrator 레벨(pipeline 의 stage_times, analysis/market 의 LLM 호출 timing)은 유지. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:45:23 +09:00
Mina Choi	fa32109658	fix(color_extractor): CSS .logo 패턴 우선순위 + lang/flag noise 필터 강화 문제: JK 성형외과 (jkplastic.com) 처럼 <h1 class="logo"><a>JK PLASTIC</a></h1> 형태로 logo 텍스트만 있고 진짜 이미지는 외부 CSS의 .logo { background-image: url(...) } 로 들어가는 사이트에서, generic <header> 첫 img 패턴이 한국어 깃발(lang-kor.png)을 먼저 잡아 잘못된 로고가 박혔음. 수정: - find_logo_url_in_html 흐름 재정렬: 1) class/id/alt/src 명시 + 부모 class="logo" + 중첩 img (specific) 2) 외부 CSS 의 .logo background-image ← generic 보다 앞으로 (class-based 라 더 specific) 3) <header>/<nav> 첫 img (가장 generic, 잘못 잡힐 위험) - noise 필터 강화: lang-kor / lang-eng / flag / country / icon- / btn- / arrow / prev / next / search 같이 logo 아닌 게 명백한 src 는 모든 단계에서 skip 검증: JK 는 lang-kor.png → logo-color.png 로 정확히 잡힘. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:45:08 +09:00
Mina Choi	dca0c78860	fix(url): _with_scheme 강화 — www 자동 보강 + 중첩 https:// 정리 + API 입력 적용 문제 1: gangnamunni.com 의 SSL 인증서가 www.gangnamunni.com 에만 유효 → 사용자가 'gangnamunni.com/hospitals/189' 같이 줬을 때 클릭 시 브라우저 SSL warning. 문제 2: LLM 출력에 'https://www.facebook.com/https://facebook.com/X' 같이 중첩된 URL이 가끔 박힘. 수정 (_with_scheme): - 중첩된 'http(s)://' 발견 시 마지막 URL 만 잘라 사용 - _WWW_REQUIRED 도메인 (gangnamunni / facebook / instagram) 은 bare 도메인이면 www. 자동 보강 api/analysis.py: main 채널(instagram/facebook/naver_blog/youtube/gangnam_unni) URL 도 _with_scheme 적용해서 DB에 정규화된 형태로 저장. 이전엔 extra channels (tiktok/EN/카카오톡/카페) 에만 적용돼있어서 강남언니 같은 main 채널이 빠져있었음. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:44:53 +09:00
Mina Choi	db42805fdb	fix(report): LLM 환각 잠금 — channel mapping 보호 + URL prefix + registry_data brand_inconsistencies 데이터 보호: - 채널-묘사 mapping 을 LLM이 swap·재해석해서 Brand Consistency Map 이 어긋났던 문제 (VIEW 한국페북에 영문 인스타 묘사가 박힌다든가) 해결. - channel_logos.channel_logos[] 의 channel / logo_description / is_official 을 그대로 박을 것 명시. 절대 swap·변형 금지. URL 환각 잠금: - LLM이 'https://www.facebook.com/' 같은 prefix를 raw URL 앞에 붙여서 'https://www.facebook.com/https://facebook.com/THEPS16445998' 같이 깨지던 문제 차단. - "URL prefix 절대 직접 만들지 마세요. 받은 URL = 출력 URL" 강제. registry_data 환각 잠금: - registry_data.website_en 같은 자유 필드를 LLM이 그럴듯하게 ('thepsclinic.com' 같이) 지어내던 문제. "데이터에 없으면 반드시 null" 강제. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:44:38 +09:00
Mina Choi	9da285e905	feat(plan): 네이버 블로그 채널 + brand_guide profile_photo 시스템 박기 네이버 블로그 채널 추가: - naver.fetch_blog_total_count: RSS에 totalCount 없으면 blog.naver.com 의 PostList 페이지 HTML에서 '(\d+)개의 글' 패턴으로 진짜 전체 글 수 추출 (RSS는 최근 50개만 줘서 그동안 totalResults=50 으로 잘못 박혔음 — 뷰성형외과 실제 554개) - analysis._naver_blog_summary 다이어트: totalPosts + latestPostDate 만 LLM에 보냄 (posts 본문/링크/제목 빼서 토큰 절약 + LLM의 무관 정보 hallucinate 방지) - plan_prompt: channelStrategies 리스트에 네이버 블로그 명시 포함 brand_guide.channel_branding.profile_photo 코드 박기: - 기존: LLM이 "공식 로고로 통일 (가이드 미보유)" 같은 fallback 문구 hallucinate - 수정: analysis._patch_plan 이 모든 채널의 profile_photo 를 brand_assets.logo_description 으로 일괄 박음 (채널 통일 전략이라 모두 동일 값) - plan_prompt: "profilePhoto 는 빈 문자열로 두세요 — 시스템이 채웁니다" 명시 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:44:18 +09:00
Mina Choi	8c1e513dc0	fix(vision): channel logo describe — 3채널씩 청크 호출로 매칭 정확도 향상 기존: 공식 로고 + 모든 채널 프로필 이미지를 한 번에 묶어 Gemini에 보냄 → LLM이 채널-이미지 매칭을 헷갈려 같은 묘사를 여러 채널에 복사하는 문제. VIEW 케이스에서 한국 페북·영문 인스타가 둘 다 "보라/노란 V자형 공식 로고" 묘사로 잘못 박혔음 (실제로는 흰배경 V자 심볼 vs 금색 VIEW로 완전히 다름). 수정: describe_channel_logos를 3채널씩 청크로 분리 + 명시적 이미지 번호 매핑: - "이미지 1 = 공식 로고, 이미지 2 = Instagram 채널, 이미지 3 = Facebook..." 식 - "공식 로고 묘사를 절대 복사하지 마세요" 강한 지시 - 청크별 병렬 호출 (asyncio.gather) - inconsistency_summary / recommendation 은 LLM 한 번 더 안 부르고 결정적 산출 비용: 호출 1회 → 청크 수 만큼 (보통 2회), 페니 수준 증가 시간: 병렬이라 거의 동일 정확도: 사용자가 본 실제 묘사와 일치하게 됨 (개별 호출 테스트로 검증) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-29 10:44:00 +09:00
Mina Choi	652265cd19	페북 수집·지표·저장 파이프라인 정리 수집: - pages + posts 두 actor 병렬 호출 (facebook-pages-scraper, facebook-posts-scraper) - 저장 필드 슬림화: 페이지 메타에서 likes/rating/email/phone/address 제거 (followers/reviews와 중복이거나 클리닉 raw_data에 이미 있음) - 게시물 저장은 캡션 160자 + likes/reactions/shares/views/isVideo/timestamp만 지표 계산 위치 이동: 리포트 시점 → 수집 시점: - recent_post_age / post_frequency / engagement 를 transform_for_storage에서 결정적으로 산출해 DB에 박음 (재계산 불필요) - 저장된 게시물은 LLM용 캡션·타입 2필드만 — 추가 슬림 단계 제거 리팩토링: - services/facebook_audit.py 신설 (instagram_audit 패턴) — _build_overrides의 인라인 클로저(_fb_page_patch)와 analysis.py의 _fb_post_metrics 분리 - collect.py / enrichment.py 가 transform_for_storage를 호출하도록 엔게이지먼트 표기: - 범위(min~max)로 표시, 전부 0인 지표는 제외 - 댓글은 actor 미제공이라 "댓글 거의 없음" 고정 부가 콘텐츠 유형: - top_content_type 은 캡션 본문 주제 추론이 필요해 LLM에 위임 - report_prompt.txt 에 facebook_audit.pages[].top_content_type 작성 지침 추가 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 13:49:22 +09:00
jaehwang	ab215395c6	db ready	2026-05-28 13:13:30 +09:00
Mina Choi	4f756cf001	인스타 highlights/계정 수집 개선 (VIEW actor + 코드로 계정 구성) - apify: 프로필 coderx, 하이라이트 igview actor로 교체. highlights/category/ following(followsCount)/profileImage(hdProfilePicUrl)/latestPosts.mediaType 수집. reel 스크래퍼 제거, post 스크래퍼 비활성화(주석) - instagram_audit.py(신규): KR·EN 계정 hard 필드를 수집 데이터로 구성 - analysis: _build_overrides에서 위 함수로 계정 구성, _patch_report가 accounts를 코드값으로 주입 (LLM은 diagnosis만, 프롬프트에서 accounts는 []로 두게 지시) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-28 09:43:03 +09:00
jaehwang	d1293f9188	뷰성형외과 전용 mock데이터 외삽 알고리즘 추가	2026-05-28 09:31:41 +09:00
Mina Choi	163e9d1c02	리포트/플랜에 브랜드·영문채널 반영 - overrides에 brandAssets·영문 인스타/페북 audit 보장 (채널별 빌더 분리) - logoRules·other_channels·channel_scores 프롬프트 수정, 스키마 입력 필드 추가 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 14:24:21 +09:00
Mina Choi	4855d44381	수집 파이프라인 통합 (enrichment 분리, raw_data merge 헬퍼) - enrichment.py: brand_assets/extra_channels/channel_logos 수집 분리 - db.merge_hospital_raw_data: raw_data read-modify-write 헬퍼 - utils: _run_optional_step·URL 헬퍼 공통화 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 13:27:39 +09:00
Mina Choi	843ccdb806	브랜드 자산(로고/색상)·채널 로고 Vision 분석 추가 - color_extractor: 홈페이지 HTML/CSS에서 로고 URL·브랜드 hex 추출 - vision: Gemini Vision 로고 묘사·채널 로고 일치 평가 - youtube: 채널 profileImage 추출 / firecrawl: clinic_info 추출 보정 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 13:27:39 +09:00
Mina Choi	9817b53be1	틱톡·영문 인스타/페북 채널 수집 추가 - apify: 틱톡 프로필 액터 - mock_urls.py: 클리닉별 채널 URL 매핑 (mockUrls.json → 파이썬 모듈) - api/analysis: homepage 매칭으로 미지원 채널 보충 (추후 DB) Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-27 13:27:39 +09:00
jaehwang	0e68cbe71b	뷰성형외과 전용 mock데이터 외삽 알고리즘 추가	2026-05-21 15:41:43 +09:00
jaehwang	cb798f7acc	instagram externalurl 수집 비활성화 (LLM이 혼동을 일으킴)	2026-05-20 18:36:29 +09:00

1 2

72 Commits (main) All Branches Search

72 Commits (main)

All Branches