AI技術で精度が向上する「文字起こし」ツール市場で、伝統の“人力型”が多くのリピーターに指示される理由

Sponsored 株式会社アラジン
弁護士JP編集部

弁護士JP編集部

AI技術で精度が向上する「文字起こし」ツール市場で、伝統の“人力型”が多くのリピーターに指示される理由
(ヨシヒロ / PIXTA)

音声認識の技術力の高まりに比例して、音声を文字に変換する市場の拡大が加速している。AIを活用した文字起こしサービスでは、精度9割以上をうたう業者も珍しくない。いまや、「文字起こし」はかつての「煩雑で多大な集中力を求められる作業」のイメージからはほど遠い。

音声を即時に文字変換するAI「文字起こし」は、DX(デジタルトランスフォーメーション)との親和性も高く、さまざまなシーンでの活用が期待される。生産性向上には必須のツールともいえ、今後さらなる需要拡大が見込まれる。

AI文字起こしの”弱点”

文字起こしツールのトレンドは、AIがけん引する形だが、選択肢は高精度のAIタイプ一択とは限らない。なぜなら、AI文字変換には「弱点」があるからだ。それはズバリ、音源の品質だ。

クリアな音声であれば、うたい文句通りに高い精度の文字変換を瞬時に実現するAI文字変換。ところが、音声が聞き取りづらかったり、雑音や発言の重なりが多かったりすると、変換精度は急落する。誤変換が散在するテキストを修正する手間は、聞き取りづらさが根っこにあるだけに、より作業負荷が大きくなる。

AIが主流のなか、選ばれている人による文字起こしの強み

そうした中、とくに正確性、専門性が求められる業種で選ばれている文字起こしサービスがある。データグリーン(https://www.data-green.jp/)の人手による文字起こしサービスだ。AIが主流になりつつある潮流にあって、なぜ、ヒューマンパワーによる同社の文字起こしが支持されているのか。その理由は大きく2つある。

ひとつは音質の修復へのこだわりだ。同社ではまず、クライアントから音源を預かると、音質を磨き上げる。独自ツールを活用することで、聞き取りづらさや雑音等をクリアにし、文字起こしを行うスタッフの負荷を軽減するのだ。

もうひとつは、関連会社のデータレスキューセンター(https://www.rescue-center.jp/)との連携で、破損した音声データでも復旧できることだ。音が聞きづらい等なら、なんとか文字を起こせるが、データ自体が破損していては、どうにもならない。100%ではないものの、破損データにも対応可能なため、同社には諦め半分の依頼者が駆け込み寺的に飛び込んでくるケースも珍しくないという。

「ここに頼めば、最悪の事態も回避できるかもしれない」。文字起こしサービスの提供を始めてまだ4年ほど(2020年7月~)の後発。それでもすでに多くのリピーターがつくなど、拡大する文字起こしサービス市場にあって、同社はその存在感を高めている。

名だたる企業に選ばれる理由

新聞社、出版社、病院、弁護士事務所、教育機関、シンクタンクなど、一部上場企業を筆頭にクライアントにはそうそうたる企業が名を連ねる。この点だけをみても、同社の文字起こしサービスの信頼性の高さが明白といえるだろう。

文字起こしの起点となる音源の磨き上げが優位性となっている同社のサービス。クリアになった音声を文字に起こすスタッフ陣も、各分野の専門性を有する人材をそろえ、無知による誤変換も可能な限り排除。とことん正確性にこだわるスタンスが、より高い精度を求める大企業や専門性の高い職種のクライアントからも頼りにされるゆえんだ。

間違いが許されない業種で特に重宝される高い信頼性

同社が2023年の1年間に対応した文字起こし・テープ起こしの合計時間は実に6399時間。そのうち、法人が66%、個人が34%だった。

高い精度が求められる内容が多いのが特徴的だ

また、文字起こし・テープ起こしの内容は、インタビュー・対談が42%、会議・理事会・委員会・監査が18%、裁判・訴訟が15%で続いている。

複数人が話者となる音声はAIが個別認識を苦手としており、また、裁判・訴訟では、一言一句により正確性が求められ、AIだけに任せるには不安が残る。その意味でこうした依頼内容が多くを占めていることは、別の観点で、同社の文字起こしサービスの信頼性の高さを証明するに十分なエビデンスといえるだろう。

人が介在する文字起こしサービスでは、スピード面で分が悪いとみるむきもあるかもしれない。その点については、年中無休の対応と、特急コースによる6時間以内での納品にも対応しており、AIに大きく劣らない。

さらに同社はプライバシーマークおよび情報セキュリティーマネジメントシステムの国際規格「ISO27001」の認証を取得しており、情報セキュリティーにおいても適切な管理体制を確立。法人の場合は、別途守秘保持契約の締結も可能で、セキュリティーを重視する業種にとっては、万全の体制が整備されている。

選べる文字起こしタイプと合理的な料金設定

文字起こし後の文章の利用目的に合わせ、文字起こしの種類を選べるのも同社サービスの強みの一つだ。たとえば、裁判で活用するなら、発言内容だけでなく、会話の雰囲気や言い回しなどもそのまま起こす「素起こし」が、インタビューや対談なら、余分な情報をカットして読みやすくする「ケバ取り」が適している。こうしたきめ細かい対応力も、同社サービスにリピートが絶えない要因だ。

気になる料金もこれだけの手間をかけるサービスでありながら、かなり良心的だ。基準は録音時間で、30分から30分区切りで料金設定されている。これに納期までの時間が短いスピードプランを選択すると、割り増しとなる。

たとえば、録音時間60分で「ゆっくりプラン」を選択した場合、中6日の納期で税込み1万1220円。これが同じ60分で中2日の「早めプラン」になると、税込み1万8480円に。当日6時間仕上げの「スーパーエクスプレスプラン(60分)」になると、税込み4万2240円となる。

目的や納期に合わせて料金をコントロールできるため、予算が限られていても選択肢があり、非常に合理的で良心的といえるだろう。

なお、音質が悪い場合などに追加料金が発生する場合もあるため、録音データの音質に不安がある場合は事前に問い合わせて確認するといいだろう。

根幹となる正確性や専門性に加え、セキュリティー、スピード、柔軟な料金体系など、文字起こしに求められるあらゆる要素を網羅的にカバーし、クライアントの要望に最大限に応えるサービス力を備える同社の文字起こし。市場拡大で競争が激化するなかでも選ばれているのには、それだけの理由がある。

  • この記事は、公開日時点の情報や法律に基づいて執筆しております。

音声・動画データの文字起こしサービス「データグリーン」

データグリーンでは音声データの解析技術と豊富な経験・ノウハウを組み合わせた精度の高い反訳サービスを提供しています。

編集部からのお願い

情報提供をお待ちしております

この記事をシェア