Yupp 种子轮揽 3300 万美元,推特前技术骨干重构 AI 模型评估体系

Yupp 如何用众包模式撕开 AI 普惠和评估的突破口?

撰文:KarenZ,Foresight News

随着 AI 技术的飞速发展,AI 模型的层出不穷和多样化让用户眼花缭乱。如何选择适合自己的 AI 模型,除传统基准测试外如何让模型精准捕捉真实需求、如何为反馈用户提供实打实的激励,成为 AI 行业亟待突破的关键命题。

Yupp 正是在这一背景下诞生的开放型平台,旨在建立一个开放、透明、社区驱动的 AI 模型评估平台。正如 Yupp 所说,「与历史上**其他技术创新相比,AI 更依赖于每个人的参与和贡献来推动进化。」

上周(6 月 13 日),Yupp.ai 宣布了 a16z crypto 领投的 3300 万美元种子轮融资,同时谷歌**科学家 Jeff Dean、X 联合创始人 Biz Stone 等豪华投资人阵营吸引了社区的目光。与此同时,Yupp 还推出了其产品,不仅为用户提供了一个探索 AI 的窗口,更通过社区参与和区块链技术重新定义了 AI 模型的评估与优化方式。

Yupp 团队和融资背景

Yupp 背后公司为 Ber Sarai Labs Inc.,由 Pankaj Gupta 和 Gilad Mishne 两位联合创始人于 2024 年 6 月共同创立,在过去 6 个月一直在秘密进行测试。Yupp 两位联合创始人和**科学家于 2010 年在推特相识,均拥有深厚的 AI 行业背景,曾在 Coinbase、Google、X 等公司工作过。

  • Pankaj Gupta:Yupp 联合创始人兼 CEO,拥有印度理工学院德里分校计算机科学和工程学士学位、斯坦福大学大学计算机科学博士学位,曾在推特担任过技术主管、个性化和推荐**经理、ML **职员(2009 年 3 月 -2014 年 5 月),在谷歌先后担任过工程总监和**工程总监(2017 年 7 月 -2021 年 3 月),也曾担任过 Coinbase India 一号员工和站点负责人,之后在 Coinbase 担任过工程副总裁和顾问(2021 年 4 月 -2024 年 5 月)。

  • Gilad Mishne:Yupp 联合创始人兼 AI 主管,曾在英特尔担任过软件工程师(1998 年 -2000 年),在雅虎担任过**科学家(2017-2010),在推特担任过**工程师和搜索总监(2010-2015),在谷歌担任过**工程经理和谷歌登月工厂机器学习主管(2019-2023)。

  • Jimmy Lin:Yupp **科学家,在麻省理工大学攻读计算机科学博士期间研究问答系统和对话界面,目前在滑铁卢大学 David R. Cheriton 计算机科学学院担任教授和 David R. Cheriton 主席。2010 年至 2012 年, Jimmy Lin 在推特参与数据分析和数据科学的基础设施建设。

本月 Yupp 官宣的 3300 万种子轮融资已于去年完成。Yupp 资本矩阵覆盖技术、投资与学术领域,除了领投方 a16z crypto 之外,谷歌**科学家 Jeff Dean、X 联合创始人 Biz Stone、Pinterest 联合创始人 Evan Sharp、 Perplexity **执行官 Aravind Srinivas 、 Cred **执行官 Kunal Shah、斯坦福大学的四位教授(Dan Boneh、Chris Re、Nick McKeown、Balaji Prabhakar)、Othman Laraki、Paul Grewal、Gokul Rajaram 和 Coinbase Ventures 亦参与其中。

Yupp 是什么?如何运作?

Yupp 定位为 AI 模型探索和评估平台,允许用户免费体验和比较各种 AI 模型,其核心理念是通过众包的方式进行模型评估:用户提交提示词,对比不同 AI 模型生成的回复,并给出较优答案和给出评定反馈,同时得到可兑现的积分激励。这些选择和反馈会被记录下来,形成用于 AI 模型后期训练和评估的数据。

Yupp 还将利用区块链等开放访问和无需许可的技术、零知识证明和挑战 / 响应机制等密码学原语和协议,以及机密计算等隐私保护技术,构建具有可证明的可信中立性、公平性和稳健性的系统。

Yupp 的运作机制可以概括为以下几点:

1、模型探索和对比:Yupp 汇集了超 500 个 AI 模型,包括 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等。用户可以在平台聊天页面找到各种 AI 模型,并进行 Prompt 测试,直观并排比较它们的优劣。

Yupp 当前有聊天页面和排行榜两个页面,其中,聊天页面设计较为简单,有消息框、文件上传功能、模型选择功能(可选)、图片上传功能、聊天私密和公开模式切换(默认私密)。

如下图所示,提问过后,Yupp 会给出两个 AI 的回答版本,然后用户选出较优版本。

值得一提的是,提问时模型默认自动选择,有时还会隐藏掉模型名称以收集更客观的反馈,当然,用户也可以随机提问。此外,Yupp 的 QuickTake AI 功能还可以提供简短总结回复。

2、用户反馈:用户在选出较优答案后,可以进一步通过点击标签反馈答案的优劣偏好,也可以用文字自由阐述。这些反馈将帮助用户定制未来在 Yupp 上的 AI 答案,也让 Yupp 能够免费提供模型。

3、反馈奖励:给出反馈后,用户会得到一个积分刮刮卡。积分可用于提问或兑现。

4、评估:用户通过选择的**回复和提供的反馈,参与到模型的评估过程中。Yupp 旨在建立一个公开透明的评估体系,让 AI 开发者可以获取有价值的训练数据,用户可以获得奖励,共同推动 AI 技术的发展。Yupp 平台具有一个名为「Yupp VIBE Score」(VIBE,Vibe Intelligence BEnchmark)的公开排行榜,旨在利用用户反馈来改进模型性能,同时保证用户 Prompt 的私密性,除非用户选择共享。

Yupp 会根据用户反馈以及响应速度等因素制定一个排行榜。排行榜中,可以按过滤器对平台上集成的 AI 模型进行排序,维度包括 VIBE 评分、概率样本的置信区间、投票情况、速度、延迟、输入 / 输出成本。

Yupp 的 AI 模型评估会结合用户的偏好数据,以更细粒度的方式对用户和评估数据进行细分,从而为 AI 开发者提供样本。Yupp 表示,凭借团队创始人在 Twitter 上应对垃圾信息和机器人问题的经验,开发了复杂的算法来剔除低质量数据,确保排名的完整性。Yupp 还组建了专门的信任与安全团队,并将继续在该领域投入大量资金。

Yupp 积分体系:消耗与兑现的平衡规则

Yupp 积分靠提问消耗、靠反馈赚取,并且部分可以兑现。Yupp 表示,如果用户负责任地使用 Yupp,将始终拥有足够的积分提问 AI 模型,并且还可以兑现一部分积分,以表示对改善生态系统状况的感激。

提问需要花费积分,初始注册后可免费获得 5000 积分。另外,总费用为默认费用、PRO 模型费用、附件提交费用、预选图片模型费用之和。

  • 基本费用: 每个提示词默认花费 50 积分。如果生成图像,则费用为 100 Yupp 积分。

  • PRO 模型: 这些**模型,仅在其他平台通过付费订阅提供。如果用户预先选择 PRO 模型,则每次提问需额外花费 50 个 Yupp 积分。

  • MAX 模型: 这些模型是使用最昂贵的模型。如果用户预先选择 MAX 模型,则每个模型每个提示词需额外花费 300 Yupp 积分(含基础费用共计 350 积分)。

  • 附件提交费用:每个附件需要花费 25 个 Yupp 积分。

  • 选择图像模型: 每个预选图像模型需额外花费 100 个 Yupp 积分。

此外,Yupp 问答默认私密,如果用户选择公开问答,仅需支付上述常规费用的一半。

如前所述,反馈模型可以赚取积分刮刮卡。笔者得到的几个积分刮刮卡在 200 到 500 积分之间。

Yupp 表示,用户可以将积分提现,换成美元、欧元、印度卢比及其他 20 多种货币,或兑换成稳定币(基于 Base 和 Solana)。Yupp 还与 Stripe、Paypal 和 Coinbase 等支付服务提供商建立了合作关系,以满足用户的不同需求。每 1000 积分可以兑换 1 美元。不过兑现功能目前不可用。为了规避女巫或滥用行为,Yupp 还设定了积分兑现规则:

  • 每日提款次数最多 1 次,提款上限为 10 美元(1 万积分);

  • 每周提款次数最多 3 次,总提款上限为 20 美元(2 万积分);

  • 每月提款次数最多 6 次,总提款上限为 50 美元(5 万积分)。

另外,Yupp 规定,购买、出售、交易或转让 Yupp 积分等此类交易违反服务条款,均视为无效,并可能导致账户立即停用。滥用可能会导致产品功能被禁用,甚至暂停账户。

如何参与?

Yupp 参与流程如下:

  • 用谷歌账号登录注册(注册获得 5000 积分,官方表示 6 月 20 日之前用「yupp-launch」code 可额外获得 2500 积分);

  • 提问 AI 模型,在两个 AI 模型中选择较优答案;

  • 选择反馈标签或提供文字反馈。

  • 用鼠标刮积分刮刮卡领取积分。

  • 自行决定是否提款(目前官方已临时关掉提款)。

小结

正如 a16z crypto 创始人和执行合伙人 Chris Dixon 表示,「Yupp 的设计将人类的判断转化为可持续的经济资源。随着新的互动替代旧的数据,数据「过期」,形成了一个自然的良性循环:更多的使用带来更新的评估;更新的评估产生更好的模型;更好的模型吸引更多的使用。所有参与者——从用户到 AI 模型构建者——都可以参与其中,并看到相同的透明规则适用于每个人,确保了一个可信的中立市场。没有人可以隐藏排行榜,也没有人可以操纵奖励或结果。」

Yupp 的口号「Every AI for everyone」,笔者认为译为「普惠 AI」更为贴切。Yupp 试图通过区块链技术与众包模式,构建 AI 时代的「评估基础设施」:让用户通过反馈获得激励,让开发者获取真实数据,**推动 AI 技术向更普惠、更可信的方向进化。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 support1012@126.com 举报,一经查实,本站将立刻删除。
标签: /
上一篇2025-06-16

相关推荐

1