PicMenu:AI 可视化菜单工具,一键拍摄餐单即可生成菜品图片
00 min
2024-11-26
2024-11-26
type
status
date
summary
tags
category
slug
icon
password
公众号
关键词
小宇宙播客
小红书
数字人视频号
笔记

PicMenu:AI 可视化菜单工具,一键拍摄餐单即可生成菜品图片

PicMenu 是一款利用 AI 技术将餐厅菜单快速可视化的工具。只需拍摄菜单照片,PicMenu 就能为每道菜生成精美的图片和详细描述,帮助餐厅提供更直观的菜品信息。

主要功能

菜单解析与生成
  • PicMenu 运用 AI 技术扫描餐厅菜单照片,自动提取菜单项并为每道菜生成高质量图像。
AI 支持的详细信息
  • 系统能智能提取并展示每道菜的附加信息,计划加入成分、来源、卡路里和口味等详细内容。
多语言与标签支持(开发中)
  • 即将推出多语言菜单解析功能,并配备标签系统(如辣味、素食、纯素等),让用户轻松筛选所需菜品。
notion image

技术架构

AI 模型
  • 使用 Together AI 的 Llama 3.2 Vision 90B 模型提取菜单信息。
  • 采用 Llama 3.1 8B 生成结构化输出(JSON 格式)。
  • 通过 Flux Schnell 模型生成高质量菜品图像。
框架与工具
  • 使用 Next.js 和 TypeScript 构建平台。
  • 用户界面采用 Tailwind CSS 和 Shadcn 设计。
  • 整合 Plausible 和 Helicone 实现分析与监控。
文件存储
  • 使用 AWS S3 存储上传的图片和生成的内容。

在线试用链接:

开发使用方法

  1. 克隆项目:git clone <https://github.com/Nutlope/picmenu>
  1. 配置环境变量:
      • 创建 .env 文件,添加 Together AI API 密钥
      • 配置 AWS S3 存储凭证
  1. 安装依赖并启动:运行 npm install,然后执行 npm run dev 启动本地开发服务

未来任务

  • 优化菜品图像真实度,提升用户体验。
  • 实现滚动加载与错误处理,提高系统稳定性。
  • 支持多语言菜单示例,扩展国际化应用。
  • 完善标签筛选功能,便于按菜品类型查找。

适用场景

  • 餐厅:便捷地将纸质菜单数字化,生成直观的菜品展示。
  • 在线餐饮平台:为用户提供丰富、互动的菜品视觉体验。
  • 多语言支持:满足全球化需求,处理多语言菜单解析。

访问更多信息:PicMenu 官网
notion image
 
上一篇
华人开发类ChatGPT的AI病理模型震撼全球!癌症预测高达94%!
下一篇
黄仁勋谈未来计算:AI、GPU与下一个亿万倍的科技突破