Commit Graph

25 Commits (4855d443813337272baeafa2cb73410531593e62)

Author SHA1 Message Date
Mina Choi 4855d44381 수집 파이프라인 통합 (enrichment 분리, raw_data merge 헬퍼)
- enrichment.py: brand_assets/extra_channels/channel_logos 수집 분리
- db.merge_hospital_raw_data: raw_data read-modify-write 헬퍼
- utils: _run_optional_step·URL 헬퍼 공통화

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-27 13:27:39 +09:00
Mina Choi 843ccdb806 브랜드 자산(로고/색상)·채널 로고 Vision 분석 추가
- color_extractor: 홈페이지 HTML/CSS에서 로고 URL·브랜드 hex 추출
- vision: Gemini Vision 로고 묘사·채널 로고 일치 평가
- youtube: 채널 profileImage 추출 / firecrawl: clinic_info 추출 보정

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-27 13:27:39 +09:00
Mina Choi 9817b53be1 틱톡·영문 인스타/페북 채널 수집 추가
- apify: 틱톡 프로필 액터
- mock_urls.py: 클리닉별 채널 URL 매핑 (mockUrls.json → 파이썬 모듈)
- api/analysis: homepage 매칭으로 미지원 채널 보충 (추후 DB)

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-27 13:27:39 +09:00
jaehwang cb798f7acc instagram externalurl 수집 비활성화 (LLM이 혼동을 일으킴) 2026-05-20 18:36:29 +09:00
jaehwang 84fd854d15 설립년도 제거 (잘못된 데이터) 2026-05-20 18:17:10 +09:00
jaehwang 8e5ce3e012 add phone formating 2026-05-20 18:16:35 +09:00
jaehwang b921a0803e patch report 2026-05-20 18:06:57 +09:00
jaehwang e8406dc0ee 의료진 수 firecrawl 해킹, 만약 필요하다면 직접 스크래핑으로 해결 필요 2026-05-20 17:58:58 +09:00
jaehwang 09bb7a71ee report 패치 함수 추가. 데이터 직결용 2026-05-20 17:16:19 +09:00
jaehwang 1f45b3e53d fix 유튜브 채널 수집 실패 버그 2026-05-20 10:00:39 +09:00
Mina Choi 18d01357c0 file 업로드 엔드포인트 추가 (Azure Blob 연동) 2026-05-19 16:13:31 +09:00
jaehwang 20fdf53264 마켓 분석 데이터 추가 2026-05-19 15:45:44 +09:00
jaehwang cda518c027 시장 조사 llm 추가 및 파이프라인 정리, db 커넥션 풀 문제 처리 2026-05-19 15:22:34 +09:00
jaehwang 42e09ae2d1 plan report 이름 통일 및 코드 정리 2026-05-18 17:15:50 +09:00
jaehwang 9b4e99abf9 report output format 변경 및 clinic info출력 추가 2026-05-18 15:40:37 +09:00
jaehwang c1f39aceff db connection pool bug 처리 2026-05-18 13:48:22 +09:00
jaehwang 602c69543c plan 추가, analysis 오탈자 제거 2026-05-18 10:23:17 +09:00
Mina Choi eec682b02c cors 허용 2026-05-15 13:58:20 +09:00
jaehwang 2b8a90e857 llm 붙임 및 리포트 생성 확인 2026-05-14 16:16:09 +09:00
jaehwang 26cd946e1b crawling check 2026-05-11 14:02:17 +09:00
jaehwang 0d3543d84d 스크래핑 로직 점검 및 추가 2026-04-30 11:58:52 +09:00
jaehwang d930679e90 integration 1차 데이터 및 DB 정의, 테스트 2026-04-24 14:19:29 +09:00
jaehwang 23e859217b 모델 위치 변경 2026-04-20 17:20:46 +09:00
jaehwang 9d306eb68e api 1차 포매팅 2026-04-20 14:41:00 +09:00
jaehwang 4f42efde18 1차 인프라 구성 2026-04-20 13:52:31 +09:00