大規模言語モデルのためのテキストアノテーション

Published on 1月 27, 2023
Last Updated on 2月 15, 2023

SiriやAlexaのようなカスタマーサービスチャットボットを使ったことがありますか?Google翻訳はどうでしょうか?これらのAI技術はすべて、自然言語処理(NLP)によって支えられています。

NLPテクノロジーは、機械学習アルゴリズムに実際のユーザーのクエリを理解し、適切な応答を生成することを教えますが、これはすべて、綿密にラベル付けされた膨大な量のテキストデータのおかげです。本ケーススタディでは、TaskUsが世界最大のAIテクノロジー企業の1社と協力し彼らのNLP研究の推進を支援しています。

課題

AI技術のリーディングカンパニーである当社のお客様は、安全でない、あるいは暗示的なプロンプトから安全にテキストを完成させる方法をNLPモデルにトレーニングさせたいと考えていました。そのため、世界トップクラスのテキストラベリング、アノテーション、編集サポートを提供できるパートナーが必要となり、私たちTaskUsの出番となったのです。

TaskUsのソリューション

弊社のチームメイト(正社員)は、お客様のAIモデルによって生成されたコンテンツをレビューするために、弊社のデータラベルリングパートナーである Labelboxを使用し、プロジェクト全体で約40,000項目のラベル付け、編集、レビューを注意深く行いました。

TaskUsは、従業員のウェルビーイングを重視しています。本プロジェクトに携わったチームメイトは、主に有害なコンテンツを扱っていたため、ウェルネスやメンタル面での休憩を勤務時間に取り入れました。このデータラベリング作業を行う従業員を第一に考えたアプローチにより、スキップ率、分類精度、完了率の全てにおいて設定された指標を上回る、100%のスコアを達成することができました。

TaskUsのデータラベリングサービスの詳細については、ケーススタディ「大規模言語モデルのためのテキストアノテーション」にて確認いただけます。

.

ケーススタディをダウンロードする

References

Nitika Bhatia Whig
AI Marketing Associate
Nitika Whig is a digital marketer and blogger with 10+years of experience and expertise in content strategy, community growth, crowd acquisition, and social media marketing. She has worked with leading internet companies like Bytedance (Tiktok) and Alibaba and is currently involved in marketing activities for AIS at TaskUs and growing our crowdsourcing platform TaskVerse. When she’s not busy writing, she loves showing off her love for fashion & shopping to her Insta ‘fam’
Related Insights