跳转到内容

输出格式(formats)

formats 决定响应 data 中会出现哪些字段。默认值是 ["markdown"]

formatdata 对应字段说明
markdowndata.markdown清洗后的 Markdown
htmldata.html清洗后的 HTML
rawHtmldata.rawHtml原始 HTML
linksdata.links链接列表
imagesdata.images图片列表
summarydata.summaryLLM 生成摘要
brandingdata.branding站点设计系统/品牌画像
audiodata.audio音频资源(例如 YouTube 转 MP3)
formats: [
{
type: 'json',
prompt: 'Extract the key fields',
schema: { type: 'object', properties: { title: { type: 'string' } } },
},
]
字段类型说明
type"json"固定值
schemaobjectJSON Schema
promptstring可选提示词

响应字段:data.json

formats: [{ type: 'screenshot', fullPage: true, quality: 80 }]
字段类型说明
type"screenshot"固定值
fullPageboolean是否整页
qualitynumber质量参数(实现相关)
viewportobject{ width, height }

响应字段:data.screenshot

formats: [{ type: 'changeTracking', modes: ['json', 'git-diff'] }]
字段类型说明
type"changeTracking"固定值
modesstring[]变更输出模式,例如 json / git-diff
tagstring可选 tag
schemaobject可选 schema
promptstring可选 prompt

响应字段:data.changeTracking

注意:changeTracking 需要 formats 同时包含 markdown

formats: [{ type: 'attributes', selectors: [{ selector: 'a', attribute: 'href' }] }]
字段类型说明
type"attributes"固定值
selectorsarray[{ selector, attribute }]

响应字段:实现相关(取决于后端版本与输出约定)。