Hacker News 中文摘要

RSS订阅

建筑文档OCR无效,我们已修复 -- OCR for construction documents does not work, we fixed it

文章摘要

AnchorGrid开发者文档提供了API端点使用指南,包括文档、图纸门检测和立面检测等功能。网站收集基础分析数据,用户可选择拒绝。文档涵盖快速入门、认证等内容,并提供博客文章和导航链接。

文章总结

AnchorGrid开发者文档:门检测接口说明

核心功能

POST /v1/drawings/detection/doors接口用于检测建筑平面图PDF中的门位置。该接口接受已上传文档的document_id,将检测任务加入队列,并返回一个可轮询结果的任务ID。检测结果以PDF坐标空间中的边界框形式返回。

处理时间

  • 免费层级:每个任务通常需要2-4分钟完成
  • 处理时间主要取决于页数和图纸复杂度
  • 专业版和企业版可使用专用GPU基础设施加速处理

请求参数

| 参数 | 类型 | 必填 | 说明 | |------|------|------|------| | document_id | UUID字符串 | 是 | 已上传PDF的ID | | page_numbers | 整数数组 | 否 | 要扫描的1-based页码,默认扫描所有页 | | webhook_url | 字符串 | 否 | 任务完成时推送结果的URL(仅限开发/专业/企业版) |

响应示例

json { "job_id": "7c9e6679-7425-40de-944b-e07fc1f90ae7", "status": "queued", "poll_url": "/v1/jobs/7c9e6679-7425-40de-944b-e07fc1f90ae7" }

结果结构

status为"complete"且model为"door-detector"时,结果包含: - document_id: 源文档UUID - doors: 门检测结果数组(包含ID、页码和边界框) - doors_found: 经过几何过滤后的门数量 - pages_analyzed: 实际分析的页数 - model_version: 模型版本号 - processing_time_ms: 处理时间(毫秒)

计费与限制

  • 费用:2积分/页(按请求页数计费)
  • 免费版:有终身积分上限(402分)
  • 开发/专业版:有月度配额限制
  • 企业版:无配额检查

错误代码

| 代码 | 说明 | |------|------| | 401 | API密钥缺失或无效 | | 402 | 免费版积分上限已满 | | 404 | 文档ID不存在或已过期 | | 422 | 验证错误(格式错误等) | | 429 | 速率限制或月度配额超限 |

(注:已移除重复的导航菜单内容、图片引用和部分技术细节,保留核心接口说明)

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 对技术可行性的质疑

    • 认为OCR处理防篡改的PDF和图像存在困难:"Of course it is not working. PDF and images are supposed to be tamper resistant" (fithisux)
    • 指出建筑图纸OCR的历史问题:"I'm reminded of the Xerox JBIG2 bug...bad construction-plans were one of the cases" (Terr_)
  2. 积极评价与期待

    • 表示支持:"Good idea :)" (alexeischiopu)
    • 认为产品具有创新性:"Your smart features looks like a game changer" (ware-intel)
    • 期待技术改变行业:"I cannot wait for the day when tech companies become players in the construction industry" (h317)
  3. 技术细节讨论

    • 关注数据训练问题:"Where are you getting the data to finetune the cv models...worried there isn't a robust enough dataset" (frogguy)
    • 比较不同技术路径:"We're taking a different path, building a parsing engine that converts CAD...into fully structured JSON" (sreekanth850)
  4. 实际应用反馈

    • 报告测试结果:"it missed 9 swinging doors...Not bad overall though" (petee)
    • 分享类似项目经验:"giving the pdf to codex pretty good at it...Only downside is cost is quite high" (tomedwrds)
  5. 市场策略建议

    • 建议专注细分市场:"become the standard by being close to 100% accurate...or make a great, comprehensive workflow for a small subset" (nostrapollo)
    • 批评营销内容:"would rather have a 'How we did it'...gave me AI generated marketing material feelings" (punnerud)
  6. 其他询问

    • 询问价格:"cool. What's pricing like?" (vessenes)
    • 询问使用场景:"What do you foresee being the end use case for this?" (testUser1228)