m00ad941

大規模言語モデルのためのテキストアノテーション

PDF
m00ad941

大規模言語モデルのためのテキストアノテーション

PDF

大規模言語モデルのためのテキストアノテーション

SiriやAlexaのようなカスタマーサービスチャットボットを使ったことがありますか?Google翻訳はどうでしょうか?これらのAI技術はすべて、自然言語処理(NLP)によって支えられています。

NLPテクノロジーは、機械学習アルゴリズムに実際のユーザーのクエリを理解し、適切な応答を生成することを教えますが、これはすべて、綿密にラベル付けされた膨大な量のテキストデータのおかげです。本ケーススタディでは、TaskUsが世界最大のAIテクノロジー企業の1社と協力し彼らのNLP研究の推進を支援しています。

課題

AI技術のリーディングカンパニーである当社のお客様は、安全でない、あるいは暗示的なプロンプトから安全にテキストを完成させる方法をNLPモデルにトレーニングさせたいと考えていました。そのため、世界トップクラスのテキストラベリング、アノテーション、編集サポートを提供できるパートナーが必要となり、私たちTaskUsの出番となったのです。

TaskUsのソリューション

弊社のチームメイト(正社員)は、お客様のAIモデルによって生成されたコンテンツをレビューするために、弊社のデータラベルリングパートナーである Labelboxを使用し、プロジェクト全体で約40,000項目のラベル付け、編集、レビューを注意深く行いました。

TaskUsは、従業員のウェルビーイングを重視しています。本プロジェクトに携わったチームメイトは、主に有害なコンテンツを扱っていたため、ウェルネスやメンタル面での休憩を勤務時間に取り入れました。このデータラベリング作業を行う従業員を第一に考えたアプローチにより、スキップ率、分類精度、完了率の全てにおいて設定された指標を上回る、100%のスコアを達成することができました。

TaskUsのデータラベリングサービスの詳細については、ケーススタディ「大規模言語モデルのためのテキストアノテーション」にて確認いただけます。

ダウンロード

    Download Case Study

    Text Data Labeling, Editing, and Review for an AI Technology Company

    _

    I understand that my information will be used in accordance with applicable data privacy law and TaskUs' Data Privacy Policy. Please review our Privacy Policy for additional information.

    .

    References