Commit Graph

16 Commits (4bc7c9652cd9d9c2169a8b760d13bd8bfafa8faa)

Author SHA1 Message Date
Mina Choi dca0c78860 fix(url): _with_scheme 강화 — www 자동 보강 + 중첩 https:// 정리 + API 입력 적용
문제 1: gangnamunni.com 의 SSL 인증서가 www.gangnamunni.com 에만 유효 →
  사용자가 'gangnamunni.com/hospitals/189' 같이 줬을 때 클릭 시 브라우저 SSL warning.
문제 2: LLM 출력에 'https://www.facebook.com/https://facebook.com/X' 같이 중첩된
  URL이 가끔 박힘.

수정 (_with_scheme):
- 중첩된 'http(s)://' 발견 시 마지막 URL 만 잘라 사용
- _WWW_REQUIRED 도메인 (gangnamunni / facebook / instagram) 은 bare 도메인이면
  www. 자동 보강

api/analysis.py: main 채널(instagram/facebook/naver_blog/youtube/gangnam_unni)
URL 도 _with_scheme 적용해서 DB에 정규화된 형태로 저장. 이전엔 extra channels
(tiktok/EN/카카오톡/카페) 에만 적용돼있어서 강남언니 같은 main 채널이 빠져있었음.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-29 10:44:53 +09:00
Mina Choi 4855d44381 수집 파이프라인 통합 (enrichment 분리, raw_data merge 헬퍼)
- enrichment.py: brand_assets/extra_channels/channel_logos 수집 분리
- db.merge_hospital_raw_data: raw_data read-modify-write 헬퍼
- utils: _run_optional_step·URL 헬퍼 공통화

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-27 13:27:39 +09:00
jaehwang b921a0803e patch report 2026-05-20 18:06:57 +09:00
jaehwang 09bb7a71ee report 패치 함수 추가. 데이터 직결용 2026-05-20 17:16:19 +09:00
jaehwang 1f45b3e53d fix 유튜브 채널 수집 실패 버그 2026-05-20 10:00:39 +09:00
Mina Choi 18d01357c0 file 업로드 엔드포인트 추가 (Azure Blob 연동) 2026-05-19 16:13:31 +09:00
jaehwang 20fdf53264 마켓 분석 데이터 추가 2026-05-19 15:45:44 +09:00
jaehwang cda518c027 시장 조사 llm 추가 및 파이프라인 정리, db 커넥션 풀 문제 처리 2026-05-19 15:22:34 +09:00
jaehwang 9b4e99abf9 report output format 변경 및 clinic info출력 추가 2026-05-18 15:40:37 +09:00
jaehwang c1f39aceff db connection pool bug 처리 2026-05-18 13:48:22 +09:00
jaehwang 602c69543c plan 추가, analysis 오탈자 제거 2026-05-18 10:23:17 +09:00
jaehwang 2b8a90e857 llm 붙임 및 리포트 생성 확인 2026-05-14 16:16:09 +09:00
jaehwang 26cd946e1b crawling check 2026-05-11 14:02:17 +09:00
jaehwang 0d3543d84d 스크래핑 로직 점검 및 추가 2026-04-30 11:58:52 +09:00
jaehwang d930679e90 integration 1차 데이터 및 DB 정의, 테스트 2026-04-24 14:19:29 +09:00
jaehwang 9d306eb68e api 1차 포매팅 2026-04-20 14:41:00 +09:00