最新情報を提供します

Qlean DatasetがAI開発を支援する「日本語・2話者・レジャーテーマトーク音声コーパスとトランスクリプト」を提供開始

新たなデータセットの概要

この新しいデータセットは、Qlean Datasetが展開する機械学習用データセットラインナップ「AIデータレシピ」に加わるものです。レジャー、趣味、娯楽をテーマに、2名の話者が対話形式で語り合う日本語音声と、その発話内容を書き起こしたトランスクリプトが収録されています。具体的には、ドラマやアニメの感想、ゲームやガジェットのレビュー、旅行や外出の体験談など、日常的な話題に基づいた会話が含まれています。

収録は台本に依存せず、自然な流れでの感想や意見交換を前提としており、実際の会話シーンを想定した音声認識や対話処理などのAI研究・開発に適しています。

データセットの詳細

データ種別 音声、テキスト
被写体属性 20代〜50代の男女
データ形式 音声データ:mp3 / wav、テキストデータ:txt
収録時間 計約400時間(1音声約5分〜60分)
音声レート 44.1kHz
対象のシーン ・2名が趣味・娯楽テーマについて、連続的に説明・解説・振り返りを行うシーン(作品へのコメント、ゲーム・ガジェット等のレビュー、旅行・外出等の体験談など) ・体験談や感想を交えながら自由に会話が展開される場面
サンプル詳細 https://qleandataset.visual-bank.co.jp/lineup/pn-018

ユースケースイメージ

このデータセットは、研究用途と産業用途の両面で活用が見込まれています。

【研究用途】

  • 日本語対話音声認識モデルの検証: 複数話者が対話するASRモデルにおいて、話者の切り替わりや応答関係を含む発話の認識精度検証に利用できます。

  • 対話文脈を考慮した言語モデル研究: 話題の展開や相互参照を含む日本語対話テキストを用い、LLMや対話モデルにおける文脈理解や応答生成の挙動を評価する研究に役立ちます。

【産業用途】

  • 音声UI・対話型AIの検証用途: 音声アシスタントや対話型インターフェースの開発において、日常会話に近い日本語対話音声を用いた入力処理や対話制御のPoC検証に利用できます。

  • 日本語LLMの対話性能評価・追加学習: 業務会話に限定されない対話テキストを用い、日本語LLMにおける自然な応答生成や対話継続性の評価、ファインチューニング用途に活用できます。

Qlean Datasetについて

Qlean Datasetは、Visual Bank傘下の株式会社アマナイメージズが提供する、商用利用が可能なAI学習用データソリューションです。画像、動画、音声、3D、テキストなど多様な形式のデータに対応し、研究用途から商用開発まで安心して利用できる環境を整備しています。

Qlean Dataset AIデータレシピ

株式会社千葉ロッテマリーンズや株式会社東洋経済新報社などのデータパートナーとの協業を通じて、業界特化・最新トレンドに即したデータラインナップ「AIデータレシピ」を継続的に拡充しています。Qlean Datasetは、AI開発現場でのデータ収集・整備の負担を軽減し、権利がクリアで法的リスクのないAI開発環境の構築を支援します。

AIデータレシピのラインナップ

「AIデータレシピ」の主な特徴

  • すべての被写体から同意を取得しています。

  • 既存データは最短1日で納品可能です。

  • カスタム撮影・収録・収集による独自データの構築にも対応しています。

Qlean Datasetの提供価値

Qlean Datasetの強み

Visual Bank株式会社について

Visual Bank株式会社は、「あらゆるデータの可能性を解き放つ」をミッションに掲げ、AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業です。漫画家向けのAI補助ツール「THE PEN」や、AI学習用データセット開発サービス「Qlean Dataset」を提供する株式会社アマナイメージズを100%子会社としています。

また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択されており、社会実装に向けた取り組みを加速させています。

関連記事

  1. UPWARD、テラスカイ(タイランド)と販売パートナー契約を締結し、タイ市場でフィールドセールスAIエージェントの提供を本格化

  2. 株式会社Elith、AI・先端技術の社会実装を加速させるため岡田隆太朗氏を経営顧問に招聘

  3. 動画生成AI「NoLang」が建設・建築業界のDXを推進 – 安全教育から営業力強化まで一気通貫で支援

  4. 人手不足を突破する「フィジカルAIカオスマップ」が公開~国内向けロボット・AIソリューション100製品を掲載~

  5. PixAIがAI二次元創作の1年間を振り返る「2025年振り返り」コンテンツを提供開始

  6. SyncLeapとドリームキャリアが営業AIアシスタントを共同開発、9年分の営業データを自然言語で分析可能に

  7. KLab、企業向けAIクリエイティブ制作事業に参入〜AIタレント・AIキャラクターで企業コミュニケーションの構造課題を解決〜

  8. CGworksの空間画像生成AI「MyRenderer」が大幅アップデート、設計・デザイン業務を強力に支援する決定版へ進化

  9. 世界の顔認識市場、2031年には145億米ドル規模へ成長予測:年平均成長率16%

  10. AIチャットアプリ「Humi」に個性豊かなAIキャラクターが多数登場

  11. オフラインイベントの集客に新機軸:株式会社CLIP、切り抜き動画マーケティング手法を確立

  12. 購読者8.5万人突破!「Mavericks AI ニュース」最新号が配信、Google「Genie 3」などを徹底解説

  13. 売れるネット広告社グループ、AI検索時代に対応する「AEOコンテンツマーケティング支援プラン」を発表

  14. JetB株式会社、AI事業本格展開に伴いコーポレートサイトを刷新 – Web制作からAIプロダクトによるBtoB支援へ明確な方針転換

  15. SmartWeb公式サイトが全面リニューアル、AIと高速Web構築でビジネスを革新する2つのソリューションに再編

  1. この記事へのコメントはありません。

  1. この記事へのトラックバックはありません。

人気記事トップ10

カテゴリー