跳转到内容

Scrape Metadata 字段

metadata 位于响应的 data.metadata 下。不同站点/不同 formats 可能会产生额外字段,以下是最常见的字段集合。

字段类型说明
titlestring页面标题
descriptionstring页面描述
languagestring语言标识
keywordsstringkeywords(若页面提供)
robotsstringrobots meta(若页面提供)
sourceURLstring最终抓取的来源 URL
urlstringURL(某些响应同时返回 sourceURLurl
字段类型说明
ogTitlestringog:title
ogDescriptionstringog:description
ogUrlstringog:url
ogImagestringog:image
ogSiteNamestringog:site_name
ogLocaleAlternatestring[]og:locale:alternate
字段类型说明
statusCodenumberHTTP status code
contentTypestringContent-Type
errorstring失败/异常信息(若有)
字段类型说明
concurrencyLimitedboolean是否触发并发限制
concurrencyQueueDurationMsnumber在队列中等待的时间(ms)

文档站点/博客等页面通常会携带额外元数据(例如 twitter:*canonical 等)。Firecrawl 可能会把它们透传到 metadata 中,以 "<any other metadata>" 的形式表示“还有其他键”。