o2o-infinith-demo/supabase/functions/_shared
Haewon Kam 36d2f1cf49 feat: archive Firecrawl screenshots to Supabase Storage (permanent URLs)
## 문제
Firecrawl이 반환하는 스크린샷 URL은 GCS Signed URL로 7일 후 만료.
리포트에 저장된 이미지 URL이 일주일 후 전부 깨짐 (403 Access Denied).

## 해결
collect-channel-data의 Vision 단계에 아카이빙 스텝 추가.
캡처 직후 base64(이미 메모리에 있음)를 Supabase Storage에 영구 업로드.

### 처리 흐름 (변경 후)
1. captureAllScreenshots() → GCS URL + base64 반환 (기존)
2. [신규] archiveTasks: base64 → Supabase Storage 업로드 (병렬)
   - 경로: screenshots/{reportId}/{screenshotId}.png
   - 성공 시 ss.url을 영구 Supabase URL로 in-place 교체
   - 실패 시 non-fatal — GCS URL fallback으로 Vision 분석 계속 진행
3. runVisionAnalysis() — base64 여전히 메모리에 있어 정상 실행 (기존)
4. channelData.screenshots 저장 시 영구 URL 사용 (자동)
   - archived: true/false 플래그 추가 (모니터링용)

### 비용/성능
- 추가 API 호출 없음 (base64 이미 캡처 시 다운로드됨)
- 업로드: ~1-3초/장 (병렬), 5MB limit, PNG/JPEG/WebP 허용
- 버킷: public (URL만 있으면 열람) + 서비스 역할만 업로드 가능

## 마이그레이션
supabase/migrations/20260407_screenshots_storage.sql
- screenshots 버킷 생성 (public, 5MB limit)
- RLS: public read / service_role write
- delete_old_screenshots() 함수: 90일 이상 된 파일 정리 (pg_cron 연동 가능)

## 타입
ScreenshotResult.archived?: boolean 필드 추가 (영구 vs GCS fallback 구분)

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-07 09:51:31 +09:00
..
config.ts feat: Sprint 1 — 7 data quality quick wins 2026-04-04 23:35:40 +09:00
dataQuality.ts feat: clinic registry DB + pipeline audit P0 fixes 2026-04-07 09:33:25 +09:00
extractSocialLinks.ts fix: type-safe string handling in extractSocialLinks/mergeSocialLinks 2026-04-04 01:17:49 +09:00
foundingYearExtractor.ts feat: clinic registry DB + pipeline audit P0 fixes 2026-04-07 09:33:25 +09:00
googlePlaces.ts feat: add API Dashboard + filled icons + pipeline improvements 2026-04-06 14:59:31 +09:00
normalizeHandles.ts fix: Instagram data collection pipeline — handle normalization + DB persistence 2026-04-03 14:45:00 +09:00
researchPrompt.ts fix: simplify Perplexity prompt — short system + direct user query 2026-04-04 01:32:54 +09:00
retry.ts fix: add Authorization header to all Edge Function calls + fix Vision Analysis 2026-04-05 10:08:03 +09:00
urlClassifier.ts feat: clinic registry DB + pipeline audit P0 fixes 2026-04-07 09:33:25 +09:00
verifyHandles.ts fix: YouTube name matching + Facebook domain fallback in channel discovery 2026-04-05 12:15:37 +09:00
visionAnalysis.ts feat: archive Firecrawl screenshots to Supabase Storage (permanent URLs) 2026-04-07 09:51:31 +09:00