# Yupp:新興プラットフォームによるAI評価モデルの再構築AIのアプリケーションが様々な業界に浸透する中、モデルの性能を正確に評価し、ユーザーの信頼を高める方法が現在の急務な課題となっています。従来の評価は集中型メカニズムに依存しており、多様なシナリオをカバーすることが難しく、実際のユーザーの好みを反映することができません。同時に、モデルの「幻覚」問題が頻発し、ユーザーは選択時に情報のカプセル化に陥りがちです。この背景の中で、Yuppは新興のプラットフォームとして、その独自のクラウドソーシングモデルとインセンティブメカニズムを駆使し、AIモデルの発見、比較、使用方法を再構築し、AI評価分野にパラダイムシフトをもたらそうとしています。## チームの背景と資金調達Yuppは「信頼不要」のAIフィードバックマーケットを構築することに取り組んでおり、多様なユーザーフィードバックがブロックチェーンと暗号経済のインセンティブの保障の下で自由に流通し、拡張性があり、公平で透明なモデル評価レイヤーを形成します。高品質な人工アノテーションデータのインセンティブ分配を通じて、Yuppはさまざまなシーンでの実際のユーザーのニーズと嗜好を迅速に把握し、AI開発者が反復的にモデルの性能を最適化するのを助けます。このプロジェクトは、Pankaj Gupta(共同創設者兼CEO)とGilad Mishne(共同創設者兼AI責任者)によって2024年6月に設立され、チーフサイエンティストのJimmy Lin(ウォータールー大学教授)もコアチームに参加しています。3人は2010年にTwitterで共に働き、大規模な推薦および検索システムを構築・最適化した経験があり、その後GoogleやCoinbaseで豊富な経験を積みました。最近、Yuppは3300万ドルのシードラウンドの資金調達を完了したことを発表しました。ある著名なベンチャーキャピタルのパートナーがリード投資し、他の投資家にはテクノロジー業界の著名人やトップベンチャーキャピタルが含まれています。## コア機能とユーザー体験AI評価プラットフォームとして、Yuppは「誰もが共有できるAI」という理念を持ち、ユーザーが最新のAIモデルを簡単に発見、比較、使用できるようにします。従来の単一応答とは異なり、Yuppは各プロンプトに対して同時に2つ(またはそれ以上)のモデルの回答を返し、「AI議会」を形成します。この設計は、ユーザーの多様な選択に対するニーズを満たすだけでなく、モデルが発生する可能性のある「幻覚」を効果的に識別し、ユーザーが比較を通じてより賢明な決定を下すのを助けます。プラットフォームは現在、テキストおよび画像生成分野をカバーする500以上のAIモデルをサポートしており、多くの著名なモデルや多数の新興モデルが含まれています。体験をさらに最適化するために、Yuppは"QuickTake"機能を導入し、長い返信を簡潔なツイートに要約できます。さらに、Yuppはユーザーのプライバシーを非常に重視しています:すべてのチャット履歴はデフォルトで非公開であり、ユーザーが自発的に公開しない限り、公開されません;公開しても、個人情報は一切漏洩しません。ユーザーはいつでも共有内容と範囲を管理できます。## 経済モデルとインセンティブメカニズムYuppはユーザーフィードバックを統合した無料利用を行い、"Yuppポイント"システムを通じてモデルの使用状況を測定します。新規ユーザー登録で5000ポイントを獲得でき、その後はモデルの応答に対する評価、好みの選択、理由の説明を通じてさらにポイントを獲得できます。フィードバックの質が高いほど、報酬も豊富になり、ユーザーは高級モデルを含むさまざまなAIサービスを持続的に無料で利用できるようになります。質問のたびに、ユーザーは2つのモデルの回答を受け取り、フィードバックを通じて「デジタルスクラッチカード」を獲得し、0〜250のYuppポイントを得ることができます。1000ポイントごとに1ドルと交換可能で、ユーザーは毎日最大10ドル、月間最大50ドルを引き出すことができます。ポイントはさまざまな通貨に交換可能で、パートナーには多くの有名な決済プラットフォームが含まれています。また、プラットフォームは特定のブロックチェーンネットワークのステーブルコインを統合し、世界中のユーザーに即時の手数料無料の報酬を提供します。より多くの人々の参加を促すために、Yuppは紹介報酬を設定しました:紹介者は5000ポイントを獲得し、被紹介者は1000ポイントを獲得します;現在、新規登録ユーザーは5000ポイントを獲得し、被紹介者はさらに2500ポイントを獲得します。## Yupp VIBEスコア:AI評価の新しいパラダイム既存のランキングの透明性不足、公平性の欠如、評価データの取得の不均衡などの問題に対処するために、Yuppはテスト版AIランキングと"Yupp VIBE (Vibe Intelligence Benchmark) Score"評価システムを導入しました。このシステムは、自然なインタラクションで生成された世界中のユーザーの好みデータを集約し、堅牢かつ信頼できる評価結果を提供することを目指しています。Yuppの評価原則には、以下が含まれます:*堅牢性:代表性、信頼性、および不正行為防止を確保します*信頼性:公平性、中立性、透明性、科学的厳密性プラットフォームは二元的な嗜好を収集するだけでなく、ユーザーに返信の長所と短所を指摘するよう促し、ユーザーの背景情報に基づいてクラスタリング分析を行い、異なるグループの嗜好の違いを示します。技術的な観点から、Yuppはブロックチェーン、暗号学的原語、ゼロ知識証明などの技術を活用して評価プロセスの公正性、透明性、検証可能性を確保することを探求しています。同時に、プラットフォームは専門のAIデータプロバイダーと協力し、アーカイブの検証と多層品質検査によってスコアラーの調整を行い、悪意のあるデータを排除しています。とGilad Mishne(共同創設者兼AI責任者)によって2024年6月に設立され、チーフサイエンティストのJimmy Lin(ウォータールー大学教授)もコアチームに参加しています。3人は2010年にTwitterで共に働き、大規模な推薦および検索システムを構築・最適化した経験があり、その後GoogleやCoinbaseで豊富な経験を積みました。
最近、Yuppは3300万ドルのシードラウンドの資金調達を完了したことを発表しました。ある著名なベンチャーキャピタルのパートナーがリード投資し、他の投資家にはテクノロジー業界の著名人やトップベンチャーキャピタルが含まれています。
コア機能とユーザー体験
AI評価プラットフォームとして、Yuppは「誰もが共有できるAI」という理念を持ち、ユーザーが最新のAIモデルを簡単に発見、比較、使用できるようにします。従来の単一応答とは異なり、Yuppは各プロンプトに対して同時に2つ(またはそれ以上)のモデルの回答を返し、「AI議会」を形成します。この設計は、ユーザーの多様な選択に対するニーズを満たすだけでなく、モデルが発生する可能性のある「幻覚」を効果的に識別し、ユーザーが比較を通じてより賢明な決定を下すのを助けます。
プラットフォームは現在、テキストおよび画像生成分野をカバーする500以上のAIモデルをサポートしており、多くの著名なモデルや多数の新興モデルが含まれています。体験をさらに最適化するために、Yuppは"QuickTake"機能を導入し、長い返信を簡潔なツイートに要約できます。
さらに、Yuppはユーザーのプライバシーを非常に重視しています:すべてのチャット履歴はデフォルトで非公開であり、ユーザーが自発的に公開しない限り、公開されません;公開しても、個人情報は一切漏洩しません。ユーザーはいつでも共有内容と範囲を管理できます。
経済モデルとインセンティブメカニズム
Yuppはユーザーフィードバックを統合した無料利用を行い、"Yuppポイント"システムを通じてモデルの使用状況を測定します。新規ユーザー登録で5000ポイントを獲得でき、その後はモデルの応答に対する評価、好みの選択、理由の説明を通じてさらにポイントを獲得できます。フィードバックの質が高いほど、報酬も豊富になり、ユーザーは高級モデルを含むさまざまなAIサービスを持続的に無料で利用できるようになります。
質問のたびに、ユーザーは2つのモデルの回答を受け取り、フィードバックを通じて「デジタルスクラッチカード」を獲得し、0〜250のYuppポイントを得ることができます。1000ポイントごとに1ドルと交換可能で、ユーザーは毎日最大10ドル、月間最大50ドルを引き出すことができます。ポイントはさまざまな通貨に交換可能で、パートナーには多くの有名な決済プラットフォームが含まれています。また、プラットフォームは特定のブロックチェーンネットワークのステーブルコインを統合し、世界中のユーザーに即時の手数料無料の報酬を提供します。
より多くの人々の参加を促すために、Yuppは紹介報酬を設定しました:紹介者は5000ポイントを獲得し、被紹介者は1000ポイントを獲得します;現在、新規登録ユーザーは5000ポイントを獲得し、被紹介者はさらに2500ポイントを獲得します。
Yupp VIBEスコア:AI評価の新しいパラダイム
既存のランキングの透明性不足、公平性の欠如、評価データの取得の不均衡などの問題に対処するために、Yuppはテスト版AIランキングと"Yupp VIBE (Vibe Intelligence Benchmark) Score"評価システムを導入しました。このシステムは、自然なインタラクションで生成された世界中のユーザーの好みデータを集約し、堅牢かつ信頼できる評価結果を提供することを目指しています。
Yuppの評価原則には、以下が含まれます:
*堅牢性:代表性、信頼性、および不正行為防止を確保します *信頼性:公平性、中立性、透明性、科学的厳密性
プラットフォームは二元的な嗜好を収集するだけでなく、ユーザーに返信の長所と短所を指摘するよう促し、ユーザーの背景情報に基づいてクラスタリング分析を行い、異なるグループの嗜好の違いを示します。
技術的な観点から、Yuppはブロックチェーン、暗号学的原語、ゼロ知識証明などの技術を活用して評価プロセスの公正性、透明性、検証可能性を確保することを探求しています。同時に、プラットフォームは専門のAIデータプロバイダーと協力し、アーカイブの検証と多層品質検査によってスコアラーの調整を行い、悪意のあるデータを排除しています。
![a16zが3300万ドルのシードラウンドをリード、Yuppはどのようにブロックチェーンとインセンティブを基にAI評価モデルを再構築するのか?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
開発の歴史と今後の展望
Yuppは2025年6月13日に正式にプラットフォームに登場し、前半の6ヶ月間は内部テストを行いました。登場以来、製品は継続的に改善されており、主な更新内容は次のとおりです:
Yuppの使用はユーザーがより良い意思決定を行うのを助けるだけでなく、AIの進化に絶え間ない力を提供します。しかし、最近立ち上げられたYuppにとって、大規模なユーザー参加の中で、データの質を持続的に確保し、潜在的な不正行為に対抗し、商業化とユーザーのインセンティブのバランスを取ることが、今後の発展において常に探求と最適化が必要な方向であることは依然として課題です。