update swagger

2026-03-26 15:42:37 +08:00
parent e0af97ac7f
commit d8db141423
8 changed files with 1274 additions and 190 deletions
@@ -11,15 +11,44 @@ from app.core import cache

 router = APIRouter()

-@router.get("/trend")
-async def get_trend_analysis(date: Optional[str] = None, type: str = "main"):
+@router.get(
+    "/trend",
+    summary="热点聚合分析",
+    description="分析各平台热点数据的共性和差异，提取共同关键词、跨平台热点话题等",
+    response_description="返回热点分析结果",
+    responses={
+        200: {"description": "成功获取热点聚合分析"},
+        500: {"description": "分析过程出错"}
+    }
+)
+async def get_trend_analysis(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    type: str = Query(
+        default="main",
+        description="分析类型：main(主题分析), platform(平台对比), cross(跨平台热点), advanced(高级分析)",
+        enum=["main", "platform", "cross", "advanced"]
+    )
+):
    """
-    获取热点聚合分析
+    **热点聚合分析**
    
-    分析各平台热点数据的共性和差异，提取共同关键词、跨平台热点话题等
+    对多个平台的热点数据进行聚合分析，识别共同话题和传播趋势。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
-    - **type**: 分析类型，可选值为 main(主题分析), platform(平台对比), cross(跨平台热点), advanced(高级分析)，默认为main
+    **分析类型说明：**
+    - `main`: 主题分析 - 提取核心热点话题和关键词
+    - `platform`: 平台对比 - 比较不同平台的特点和差异
+    - `cross`: 跨平台热点 - 识别在多个平台同时出现的话题
+    - `advanced`: 高级分析 - 提供更深层次的数据洞察
+    
+    **应用场景：**
+    - 舆情监控
+    - 热点追踪
+    - 内容运营决策
+    - 市场趋势分析
    """
    try:
        if not date:
@@ -45,14 +74,37 @@ async def get_trend_analysis(date: Optional[str] = None, type: str = "main"):
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/platform-comparison")
-async def get_platform_comparison(date: Optional[str] = None):
+@router.get(
+    "/platform-comparison",
+    summary="平台对比分析",
+    description="分析各平台热点数据的特点、热度排行、更新频率等，比较不同平台间的异同",
+    response_description="返回平台对比分析结果",
+    responses={
+        200: {"description": "成功获取平台对比分析"}
+    }
+)
+async def get_platform_comparison(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    )
+):
    """
-    获取平台对比分析
+    **平台对比分析**
    
-    分析各平台热点数据的特点、热度排行、更新频率等，比较不同平台间的异同
+    对比分析不同平台的特点、热度分布和内容特征。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
+    **分析维度：**
+    - 数据统计：各平台新闻数量、平均热度
+    - 更新频率：数据更新速度
+    - 热度排行：按平台热度排序
+    - 特征分析：各平台的内容特点
+    
+    **适用场景：**
+    - 平台选择决策
+    - 投放策略制定
+    - 用户画像分析
    """
    try:
        if not date:
@@ -78,15 +130,62 @@ async def get_platform_comparison(date: Optional[str] = None):
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/cross-platform")
-async def get_cross_platform_analysis(date: Optional[str] = None, refresh: bool = False):
+@router.get(
+    "/cross-platform",
+    summary="跨平台热点分析",
+    description="分析在多个平台上出现的热点话题，以及热点的传播路径",
+    response_description="返回跨平台热点分析结果",
+    responses={
+        200: {
+            "description": "成功获取跨平台热点分析",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "success",
+                        "date": "2024-01-15",
+                        "cross_platform_topics": [
+                            {
+                                "topic": "某明星事件",
+                                "platforms": ["weibo", "douyin", "baidu"],
+                                "first_platform": "weibo",
+                                "spread_path": ["weibo", "zhihu", "baidu", "douyin"],
+                                "heat_trend": "rising"
+                            }
+                        ],
+                        "topic_count": 15,
+                        "avg_platforms_per_topic": 3.5
+                    }
+                }
+            }
+        }
+    }
+)
+async def get_cross_platform_analysis(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    refresh: bool = Query(
+        default=False,
+        description="是否强制刷新缓存"
+    )
+):
    """
-    获取跨平台热点分析
+    **跨平台热点分析**
    
-    分析在多个平台上出现的热点话题，以及热点的传播路径
+    识别在多个平台同时出现的热点话题，分析传播路径和发展趋势。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
-    - **refresh**: 可选，是否强制刷新缓存，默认为False
+    **分析内容：**
+    - 跨平台话题识别
+    - 首发平台判断
+    - 传播路径追踪
+    - 热度趋势分析
+    
+    **价值：**
+    - 发现全网热点
+    - 追踪舆情走向
+    - 把握传播规律
    """
    try:
        if not date:
@@ -114,15 +213,61 @@ async def get_cross_platform_analysis(date: Optional[str] = None, refresh: bool
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/advanced")
-async def get_advanced_analysis(date: Optional[str] = None, refresh: bool = False):
+@router.get(
+    "/advanced",
+    summary="高级分析",
+    description="提供更深入的热点分析，包括关键词云图、情感分析、热点演变趋势等",
+    response_description="返回高级分析结果",
+    responses={
+        200: {
+            "description": "成功获取高级分析",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "success",
+                        "date": "2024-01-15",
+                        "keyword_cloud": [{"word": "AI", "weight": 95}],
+                        "sentiment_analysis": {
+                            "positive": 45,
+                            "neutral": 40,
+                            "negative": 15
+                        },
+                        "evolution_trend": [
+                            {"hour": "00:00", "heat": 5000},
+                            {"hour": "12:00", "heat": 8500}
+                        ]
+                    }
+                }
+            }
+        }
+    }
+)
+async def get_advanced_analysis(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    refresh: bool = Query(
+        default=False,
+        description="是否强制刷新缓存"
+    )
+):
    """
-    获取高级分析
+    **高级分析**
    
-    提供更深入的热点分析，包括关键词云图、情感分析、热点演变趋势等
+    提供深度的数据分析功能，包括词云、情感分析和演变趋势。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
-    - **refresh**: 可选，是否强制刷新缓存，默认为False
+    **分析模块：**
+    - 关键词云图：可视化展示高频词汇
+    - 情感分析：正/中/负向情感分布
+    - 演变趋势：时间维度上的热度变化
+    - 深度洞察：数据背后的规律
+    
+    **适用场景：**
+    - 深度报告生成
+    - 趋势研究
+    - 舆情分析
    """
    try:
        if not date:
@@ -150,14 +295,60 @@ async def get_advanced_analysis(date: Optional[str] = None, refresh: bool = Fals
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/prediction")
-async def get_trend_prediction(date: Optional[str] = None):
+@router.get(
+    "/prediction",
+    summary="热点趋势预测",
+    description="基于历史数据预测热点话题的发展趋势，包括上升趋势、下降趋势、持续热门话题等",
+    response_description="返回热点预测结果",
+    responses={
+        200: {
+            "description": "成功获取热点预测",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "success",
+                        "date": "2024-01-15",
+                        "rising_topics": [
+                            {"topic": "新技术发布", "trend": "rising", "confidence": 0.85}
+                        ],
+                        "declining_topics": [
+                            {"topic": "旧闻", "trend": "declining", "confidence": 0.75}
+                        ],
+                        "sustained_hot_topics": [
+                            {"topic": "持续热点", "trend": "stable", "duration": "3 天"}
+                        ]
+                    }
+                }
+            }
+        }
+    }
+)
+async def get_trend_prediction(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    )
+):
    """
-    获取热点趋势预测
+    **热点趋势预测**
    
-    基于历史数据预测热点话题的发展趋势，包括上升趋势、下降趋势、持续热门话题等
+    基于历史数据和算法模型预测热点话题的未来发展趋势。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
+    **预测类型：**
+    - 上升趋势：热度正在上涨的话题
+    - 下降趋势：热度逐渐消退的话题
+    - 持续热门：长期保持高热度的话题
+    
+    **输出指标：**
+    - 趋势方向：rising/declining/stable
+    - 置信度：预测的可信程度 (0-1)
+    - 持续时间：话题预计持续的时间
+    
+    **应用价值：**
+    - 提前布局内容
+    - 把握流量机会
+    - 规避过时话题
    """
    try:
        if not date:
@@ -183,18 +374,89 @@ async def get_trend_prediction(date: Optional[str] = None):
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/keyword-cloud")
-async def get_keyword_cloud(date: Optional[str] = None, refresh: bool = False, platforms: Optional[str] = None, category: Optional[str] = None, keyword_count: int = 200):
+@router.get(
+    "/keyword-cloud",
+    summary="关键词云图",
+    description="提取热点数据中的关键词，按不同类别（科技、娱乐、社会等）进行分类，用于生成词云",
+    response_description="返回关键词云图数据",
+    responses={
+        200: {
+            "description": "成功获取关键词云图",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "success",
+                        "date": "2024-01-15",
+                        "keyword_clouds": {
+                            "科技": [
+                                {"word": "人工智能", "weight": 95},
+                                {"word": "大模型", "weight": 88}
+                            ],
+                            "娱乐": [
+                                {"word": "电影", "weight": 75},
+                                {"word": "明星", "weight": 70}
+                            ]
+                        },
+                        "total_keywords": 200
+                    }
+                }
+            }
+        }
+    }
+)
+async def get_keyword_cloud(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    refresh: bool = Query(
+        default=False,
+        description="是否强制刷新缓存"
+    ),
+    platforms: Optional[str] = Query(
+        default=None,
+        description="指定平台，多个平台用逗号分隔，如 baidu,weibo",
+        example="baidu,weibo"
+    ),
+    category: Optional[str] = Query(
+        default=None,
+        description="指定分类，如科技、娱乐等",
+        example="科技"
+    ),
+    keyword_count: int = Query(
+        default=200,
+        ge=50,
+        le=1000,
+        description="返回的关键词数量，范围 50-1000"
+    )
+):
    """
-    获取关键词云图数据
+    **关键词云图**
    
-    提取热点数据中的关键词，按不同类别（科技、娱乐、社会等）进行分类，用于生成词云
+    从热点数据中提取高频关键词，并按类别分类，可用于可视化展示。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
-    - **refresh**: 可选，是否强制刷新缓存，默认为False
-    - **platforms**: 可选，指定平台，多个平台用逗号分隔，如"baidu,weibo"
-    - **category**: 可选，指定分类，如"科技"、"娱乐"等
-    - **keyword_count**: 可选，返回的关键词数量，默认为200
+    **参数说明：**
+    - `platforms`: 限定分析的平台范围
+    - `category`: 筛选特定分类的关键词
+    - `keyword_count`: 返回的关键词数量
+    
+    **分类体系：**
+    - 科技：互联网、数码、AI 等
+    - 娱乐：影视、明星、综艺等
+    - 社会：民生、时事等
+    - 体育：赛事、运动员等
+    - 财经：经济、金融、股市等
+    
+    **数据格式：**
+    每个关键词包含：
+    - `word`: 词语本身
+    - `weight`: 权重值（基于词频和重要性）
+    
+    **应用场景：**
+    - 数据可视化
+    - 内容标签生成
+    - 主题挖掘
    """
    try:
        if not date:
@@ -228,16 +490,74 @@ async def get_keyword_cloud(date: Optional[str] = None, refresh: bool = False, p
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/data-visualization")
-async def get_data_visualization(date: Optional[str] = None, refresh: bool = False, platforms: str = None):
+@router.get(
+    "/data-visualization",
+    summary="数据可视化分析",
+    description="提供热点数据的可视化分析，包括主题热度分布图",
+    response_description="返回数据可视化分析结果",
+    responses={
+        200: {
+            "description": "成功获取数据可视化分析",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "success",
+                        "date": "2024-01-15",
+                        "theme_distribution": {
+                            "科技": 35,
+                            "娱乐": 25,
+                            "社会": 20,
+                            "财经": 15,
+                            "体育": 5
+                        },
+                        "platform_heatmap": {
+                            "weibo": {"morning": 80, "afternoon": 95, "evening": 100},
+                            "zhihu": {"morning": 60, "afternoon": 75, "evening": 85}
+                        },
+                        "charts_data": {...}
+                    }
+                }
+            }
+        }
+    }
+)
+async def get_data_visualization(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    refresh: bool = Query(
+        default=False,
+        description="是否强制刷新缓存"
+    ),
+    platforms: str = Query(
+        default=None,
+        description="指定要分析的平台，多个平台用逗号分隔",
+        example="baidu,weibo,douyin"
+    )
+):
    """
-    获取数据可视化分析
+    **数据可视化分析**
    
-    提供热点数据的可视化分析，包括主题热度分布图
+    提供用于前端可视化的结构化数据分析结果。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
-    - **refresh**: 可选，是否强制刷新缓存，默认为False
-    - **platforms**: 可选，指定要分析的平台，多个平台用逗号分隔，例如：baidu,weibo,douyin
+    **可视化类型：**
+    - 主题热度分布图：饼图/柱状图数据
+    - 平台热力图：时间段热度对比
+    - 趋势线图：时间序列数据
+    - 排行榜：TOP N 数据
+    
+    **输出格式：**
+    数据格式适合常见图表库（ECharts、Chart.js 等）直接使用。
+    
+    **支持的平台筛选：**
+    可以指定部分平台进行分析，减少数据量。
+    
+    **典型应用：**
+    - Dashboard 展示
+    - 数据报表
+    - 实时监控大屏
    """
    try:
        if not date:
@@ -270,16 +590,86 @@ async def get_data_visualization(date: Optional[str] = None, refresh: bool = Fal
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
        }

-@router.get("/trend-forecast")
-async def get_trend_forecast(date: Optional[str] = None, refresh: bool = False, time_range: str = "24h"):
+@router.get(
+    "/trend-forecast",
+    summary="热点趋势预测分析",
+    description="分析热点话题的演变趋势，预测热点的发展方向",
+    response_description="返回热点趋势预测分析结果",
+    responses={
+        200: {
+            "description": "成功获取热点趋势预测",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "success",
+                        "date": "2024-01-15",
+                        "time_range": "24h",
+                        "forecast": [
+                            {
+                                "topic": "热门话题 A",
+                                "current_heat": 8500,
+                                "predicted_heat": 9500,
+                                "trend": "rising",
+                                "confidence": 0.82
+                            },
+                            {
+                                "topic": "热门话题 B",
+                                "current_heat": 6000,
+                                "predicted_heat": 4500,
+                                "trend": "declining",
+                                "confidence": 0.75
+                            }
+                        ],
+                        "key_insights": "预计未来 24 小时内，科技类话题将持续升温..."
+                    }
+                }
+            }
+        }
+    }
+)
+async def get_trend_forecast(
+    date: Optional[str] = Query(
+        default=None,
+        description="指定日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    refresh: bool = Query(
+        default=False,
+        description="是否强制刷新缓存"
+    ),
+    time_range: str = Query(
+        default="24h",
+        description="预测时间范围：24h(24 小时), 7d(7 天), 30d(30 天)",
+        enum=["24h", "7d", "30d"]
+    )
+):
    """
-    获取热点趋势预测分析
+    **热点趋势预测分析**
    
-    分析热点话题的演变趋势，预测热点的发展方向
+    基于时间序列分析预测热点话题的未来发展趋势。
    
-    - **date**: 可选，指定日期，格式为YYYY-MM-DD，默认为当天
-    - **refresh**: 可选，是否强制刷新缓存，默认为False
-    - **time_range**: 可选，预测时间范围，可选值为 24h(24小时), 7d(7天), 30d(30天)，默认为24h
+    **预测时间范围：**
+    - `24h`: 短期预测，适合快速变化的话题
+    - `7d`: 中期预测，适合持续性话题
+    - `30d`: 长期预测，适合重大事件
+    
+    **输出内容：**
+    - 当前热度值
+    - 预测热度值
+    - 趋势方向（上升/下降/平稳）
+    - 置信度评分
+    - 关键洞察总结
+    
+    **预测维度：**
+    - 整体热度走势
+    - 分话题发展趋势
+    - 平台表现预测
+    - 新兴话题发现
+    
+    **业务价值：**
+    - 内容策划参考
+    - 资源投放决策
+    - 风险预警
    """
    try:
        if not date:
@@ -288,7 +678,7 @@ async def get_trend_forecast(date: Optional[str] = None, refresh: bool = False,
        # 验证时间范围参数
        valid_time_ranges = ["24h", "7d", "30d"]
        if time_range not in valid_time_ranges:
-            time_range = "24h"  # 默认使用24小时
+            time_range = "24h"  # 默认使用 24 小时
        
        # 从缓存中获取数据
        cache_key = f"analysis:trend_forecast:{date}:{time_range}"
@@ -311,4 +701,4 @@ async def get_trend_forecast(date: Optional[str] = None, refresh: bool = False,
            "message": str(e),
            "date": date or datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d"),
            "time_range": time_range
-        } 
+        } 
@@ -4,7 +4,8 @@ from datetime import datetime
 from typing import List, Dict, Any, Optional

 import pytz
-from fastapi import APIRouter
+from fastapi import APIRouter, Query, Path
+from fastapi.responses import JSONResponse

 from app.core import cache
 from app.services import crawler_factory
@@ -13,8 +14,43 @@ from app.utils.logger import log
 router = APIRouter()


-@router.get("/")
-def get_hot_news(date: str = None, platform: str = None):
+@router.get(
+    "/",
+    summary="获取单个平台的热门新闻",
+    description="从指定平台获取特定日期的热门新闻数据",
+    response_description="返回包含新闻列表的 JSON 对象",
+    responses={
+        200: {"description": "成功获取新闻数据"},
+        404: {"description": "平台不存在"}
+    }
+)
+def get_hot_news(
+    date: str = Query(
+        default=None,
+        description="日期，格式为 YYYY-MM-DD，默认为当天（北京时间）",
+        example="2024-01-15"
+    ),
+    platform: str = Query(
+        default=None,
+        description=f"平台代码，可选值：{', '.join(crawler_factory.keys())}",
+        example="weibo"
+    )
+):
+    """
+    **获取指定平台的热门新闻**
+    
+    根据指定的平台和日期获取热门新闻列表。数据来源于缓存，每 30 分钟更新一次。
+    
+    **参数说明：**
+    - `platform`: 必需，平台标识符（如：baidu, weibo, zhihu, github 等）
+    - `date`: 可选，查询日期，默认当天
+    
+    **支持的平台：**
+    - 综合资讯：百度、微博、知乎、抖音等
+    - 科技：GitHub、HackerNews、掘金、少数派等
+    - 财经：雪球、东方财富等
+    - 社区：贴吧、虎扑、豆瓣等
+    """
    if platform not in crawler_factory.keys():
        return {
            "status": "404",
@@ -41,16 +77,33 @@ def get_hot_news(date: str = None, platform: str = None):
    }


-@router.get("/all")
-def get_all_platforms_news(date: str = None):
+@router.get(
+    "/all",
+    summary="获取所有平台的热门新闻",
+    description="一次性获取所有支持平台的热门新闻数据",
+    response_description="返回包含所有平台新闻的 JSON 对象",
+    responses={
+        200: {"description": "成功获取所有平台新闻数据"}
+    }
+)
+def get_all_platforms_news(
+    date: str = Query(
+        default=None,
+        description="日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    )
+):
    """
-    获取所有平台的热门新闻
+    **获取所有平台的热门新闻**
    
-    Args:
-        date: 日期，格式为YYYY-MM-DD，默认为当天
+    一次性获取所有支持平台的热门新闻数据，适合需要全量数据的场景。
    
-    Returns:
-        包含所有平台新闻的字典，键为平台名称，值为新闻列表
+    **返回数据说明：**
+    返回一个字典，键为平台名称，值为该平台的新闻列表
+    
+    **注意事项：**
+    - 数据量较大，建议按需使用
+    - 部分平台可能没有缓存数据，返回空数组
    """
    if not date:
        date = datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
@@ -76,17 +129,41 @@ def get_all_platforms_news(date: str = None):
    }


-@router.get("/multi")
-def get_multi_platforms_news(date: str = None, platforms: str = None):
+@router.get(
+    "/multi",
+    summary="获取多个平台的热门新闻",
+    description="批量获取指定平台的热门新闻数据",
+    response_description="返回包含指定平台新闻的 JSON 对象",
+    responses={
+        200: {"description": "成功获取多平台新闻数据"},
+        404: {"description": "平台参数无效"}
+    }
+)
+def get_multi_platforms_news(
+    date: str = Query(
+        default=None,
+        description="日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    platforms: str = Query(
+        default=None,
+        description="平台列表，逗号分隔，例如：weibo,baidu,zhihu",
+        example="weibo,baidu,zhihu"
+    )
+):
    """
-    获取多个平台的热门新闻
+    **获取多个平台的热门新闻**
    
-    Args:
-        date: 日期，格式为YYYY-MM-DD，默认为当天
-        platforms: 平台列表，以逗号分隔，例如 "weibo,baidu,zhihu"
+    批量获取指定平台的热门新闻数据，相比 `/all` 接口更加灵活。
    
-    Returns:
-        包含指定平台新闻的字典，键为平台名称，值为新闻列表
+    **参数说明：**
+    - `platforms`: 必需，平台列表，逗号分隔
+    - `date`: 可选，查询日期
+    
+    **使用示例：**
+    ```
+    /multi?platforms=weibo,baidu,zhihu&date=2024-01-15
+    ```
    """
    if not date:
        date = datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
@@ -131,19 +208,62 @@ def get_multi_platforms_news(date: str = None, platforms: str = None):
    }


-@router.get("/search")
-def search_news(keyword: str, date: str = None, platforms: str = None, limit: int = 20):
+@router.get(
+    "/search",
+    summary="搜索新闻",
+    description="按关键词搜索跨平台的热门新闻",
+    response_description="返回包含搜索结果的 JSON 对象",
+    responses={
+        200: {"description": "成功获取搜索结果"},
+        404: {"description": "无有效平台"}
+    }
+)
+def search_news(
+    keyword: str = Query(
+        default=...,
+        description="搜索关键词",
+        example="AI"
+    ),
+    date: str = Query(
+        default=None,
+        description="日期，格式为 YYYY-MM-DD，默认为当天",
+        example="2024-01-15"
+    ),
+    platforms: str = Query(
+        default=None,
+        description="平台列表，逗号分隔，默认搜索所有平台",
+        example="weibo,baidu,zhihu"
+    ),
+    limit: int = Query(
+        default=20,
+        ge=1,
+        le=100,
+        description="返回结果数量限制，范围 1-100",
+        example=20
+    )
+):
    """
-    搜索新闻
+    **搜索新闻**
    
-    Args:
-        keyword: 搜索关键词
-        date: 日期，格式为YYYY-MM-DD，默认为当天
-        platforms: 平台列表，以逗号分隔，例如 "weibo,baidu,zhihu"，默认搜索所有平台
-        limit: 返回结果数量限制，默认为20
+    按关键词在指定平台和日期的新闻中搜索相关内容。
    
-    Returns:
-        包含搜索结果的字典，键为状态码、数据、消息、总结果数量和搜索结果数量
+    **参数说明：**
+    - `keyword`: 必需，搜索关键词
+    - `date`: 可选，搜索日期
+    - `platforms`: 可选，限定搜索平台
+    - `limit`: 可选，返回结果数量，默认 20，最大 100
+    
+    **搜索逻辑：**
+    1. 从各平台获取新闻数据
+    2. 按关键词匹配标题
+    3. 按平台分组并按排名排序
+    4. 返回限定数量的结果
+    
+    **返回字段说明：**
+    - `source`: 新闻来源平台
+    - `rank`: 排名
+    - `category`: 分类
+    - `sub_category`: 子分类
    """
    if not date:
        date = datetime.now(pytz.timezone('Asia/Shanghai')).strftime("%Y-%m-%d")
@@ -184,7 +304,7 @@ def search_news(keyword: str, date: str = None, platforms: str = None, limit: in
                if not isinstance(item, dict):
                    continue
                
-                # 处理rank字段
+                # 处理 rank 字段
                rank_value = ""
                if "rank" in item and item["rank"]:
                    rank_value = str(item["rank"]).replace("#", "")
@@ -292,4 +412,3 @@ def _get_subcategory_for_platform(platform: str) -> str:
        "shaoshupai": "数码"
    }
    return subcategories.get(platform, "其他")
-
@@ -9,15 +9,61 @@ from app.utils.logger import log

 import requests
 from bs4 import BeautifulSoup
-from fastapi import APIRouter
+from fastapi import APIRouter, Query
+from fastapi.responses import JSONResponse

 from app.core import cache

 router = APIRouter()


-@router.get("/")
-def get_meta(url: str = None):
+@router.get(
+    "/",
+    summary="获取网站元数据",
+    description="提取指定网页的元数据信息，包括标题、描述、关键词、Open Graph 标签、Twitter Card 标签和 favicon",
+    response_description="返回包含网站元数据的 JSON 对象",
+    responses={
+        200: {"description": "成功获取网站元数据"},
+        404: {"description": "URL 参数缺失或无法访问"}
+    }
+)
+def get_meta(
+    url: str = Query(
+        default=...,
+        description="要获取元数据的网页 URL",
+        example="https://www.example.com"
+    )
+):
+    """
+    **获取网站元数据**
+    
+    提取指定网页的各种元数据信息，支持标准 meta 标签、Open Graph 协议和 Twitter Card 协议。
+    
+    **功能特性：**
+    - 自动检测并提取页面标题、描述、关键词
+    - 支持 Open Graph 协议（Facebook）
+    - 支持 Twitter Card 协议
+    - 自动查找 favicon 图标地址
+    - 内置缓存机制，相同 URL 不会重复请求
+    
+    **提取字段说明：**
+    - `title`: 页面标题
+    - `description`: 页面描述
+    - `keywords`: 页面关键词
+    - `author`: 作者信息
+    - `og:*`: Open Graph 相关字段
+    - `twitter:*`: Twitter Card 相关字段
+    - `favicon_url`: 网站图标 URL
+    
+    **缓存策略：**
+    - 首次请求会实际抓取网页
+    - 后续请求从 Redis 缓存读取（TTL: 60 秒）
+    - 响应中 `cache` 字段标识是否来自缓存
+    
+    **注意事项：**
+    - 部分网站可能有反爬机制，使用 cloudscraper 进行绕过
+    - 动态渲染的内容可能无法完整获取
+    """
    if not url:
        return {
            "status": "404",
@@ -56,7 +56,35 @@ app = FastAPI(
    title=app_config.title,
    description=app_config.description,
    version=app_config.version,
-    lifespan=lifespan
+    lifespan=lifespan,
+    # Swagger/OpenAPI 配置
+    docs_url="/docs",  # Swagger UI 路径
+    redoc_url="/redoc",  # ReDoc 路径
+    openapi_url="/openapi.json",  # OpenAPI schema 路径
+    openapi_tags=[
+        {
+            "name": "Daily News",
+            "description": "每日热点新闻数据接口，支持 22+ 个平台（百度、微博、知乎、GitHub 等）"
+        },
+        {
+            "name": "Website Meta",
+            "description": "网站元数据提取工具，可获取指定 URL 的标题、描述、图标等信息"
+        },
+        {
+            "name": "Analysis",
+            "description": "新闻趋势分析和预测功能"
+        },
+        {
+            "name": "Health",
+            "description": "健康检查接口"
+        }
+    ],
+    openapi_extra={
+        "externalDocs": {
+            "description": "项目源码仓库",
+            "url": "https://github.com/hot-news/hot_news-main"
+        }
+    }
 )

 # 添加CORS中间件
@@ -83,8 +111,39 @@ app.include_router(web_tools.router, prefix="/api/v1/tools/website-meta", tags=[
 app.include_router(analysis.router, prefix="/api/v1/analysis", tags=["Analysis"])

 # 健康检查端点
-@app.get("/health", tags=["Health"])
+@app.get(
+    "/health",
+    summary="健康检查",
+    description="检查 API 服务运行状态，返回服务状态和版本号",
+    response_description="返回服务健康状态信息",
+    responses={
+        200: {
+            "description": "服务正常运行",
+            "content": {
+                "application/json": {
+                    "example": {
+                        "status": "healthy",
+                        "version": "1.0.0"
+                    }
+                }
+            }
+        }
+    },
+    tags=["Health"]
+)
 async def health_check():
+    """
+    **健康检查接口**
+    
+    用于监控服务运行状态，可用于：
+    - 负载均衡器健康检查
+    - 容器编排平台存活探测
+    - 监控系统状态检测
+    
+    **返回字段：**
+    - `status`: 服务状态（healthy/unhealthy）
+    - `version`: 当前服务版本
+    """
    return {"status": "healthy", "version": app_config.version}

 # 如果直接运行此文件