type
status
date
summary
tags
category
slug
icon
password
公众号
关键词
小宇宙播客
小红书
数字人视频号
笔记
PicMenu:AI 可视化菜单工具,一键拍摄餐单即可生成菜品图片
PicMenu 是一款利用 AI 技术将餐厅菜单快速可视化的工具。只需拍摄菜单照片,PicMenu 就能为每道菜生成精美的图片和详细描述,帮助餐厅提供更直观的菜品信息。
主要功能
菜单解析与生成
- PicMenu 运用 AI 技术扫描餐厅菜单照片,自动提取菜单项并为每道菜生成高质量图像。
AI 支持的详细信息
- 系统能智能提取并展示每道菜的附加信息,计划加入成分、来源、卡路里和口味等详细内容。
多语言与标签支持(开发中)
- 即将推出多语言菜单解析功能,并配备标签系统(如辣味、素食、纯素等),让用户轻松筛选所需菜品。
技术架构
AI 模型:
- 使用 Together AI 的 Llama 3.2 Vision 90B 模型提取菜单信息。
- 采用 Llama 3.1 8B 生成结构化输出(JSON 格式)。
- 通过 Flux Schnell 模型生成高质量菜品图像。
框架与工具:
- 使用 Next.js 和 TypeScript 构建平台。
- 用户界面采用 Tailwind CSS 和 Shadcn 设计。
- 整合 Plausible 和 Helicone 实现分析与监控。
文件存储:
- 使用 AWS S3 存储上传的图片和生成的内容。
在线试用链接:
开发使用方法
- 克隆项目:
git clone <https://github.com/Nutlope/picmenu
>
- 配置环境变量:
- 创建
.env
文件,添加 Together AI API 密钥 - 配置 AWS S3 存储凭证
- 安装依赖并启动:运行
npm install
,然后执行npm run dev
启动本地开发服务
未来任务
- 优化菜品图像真实度,提升用户体验。
- 实现滚动加载与错误处理,提高系统稳定性。
- 支持多语言菜单示例,扩展国际化应用。
- 完善标签筛选功能,便于按菜品类型查找。
适用场景
- 餐厅:便捷地将纸质菜单数字化,生成直观的菜品展示。
- 在线餐饮平台:为用户提供丰富、互动的菜品视觉体验。
- 多语言支持:满足全球化需求,处理多语言菜单解析。
访问更多信息:PicMenu 官网
- Author:AI博士Charlii
- URL:https://www.charliiai.com//%E6%9C%80%E6%96%B0%E8%B5%84%E8%AE%AF/picmenu
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!