名古屋の編集プロダクション・エディマートが取材や編集のノウハウを伝えるメディア「エディマグ」 エディマートが取材や編集の
ノウハウを伝えるメディア

  • TOP
  • 伝え方・働き方
  • 「AI文字起こしが働き方を変える」。Rimo Voiceが目指す、議事録の自動化と新しい仕事スタイル/Rimo合同会社代表・相川直視

2021.07.29 Thu

伝え方・働き方

「AI文字起こしが働き方を変える」。Rimo Voiceが目指す、議事録の自動化と新しい仕事スタイル/Rimo合同会社代表・相川直視

イラスト

文字起こしとは、会議の議事録やインタビュー記事の作成のために、録音した音源を文字に起こす作業のこと

ライターや編集者にとっても避けて通れない仕事ですが、慣れた人でも録音時間の3~4倍の時間を要し、効率化は難しいとされてきました。GoogleやAmazonをはじめ各社が提供する文字起こしサービスが存在するものの、満足できる精度やスピードには達していないのが現状…。

そんな中、注目を集めているのが2020年9月にリリースされた「Rimo Voice(リモボイス)」。1時間の音声データをわずか5分ほどで書き起こしてくれ、高い変換精度を持つサービスです。

開発を手がけたのは、副業やリモートでの働き方をサポートするツール・サービスの提供を目指す「Rimo合同会社」。

起業後初のプロダクトとなるRimo Voiceを、単なる文字起こしサービスではなく、働き方改革の第一歩だと位置づけています一体どんなサービスで、いかに人々の働き方を変えることができるのかRimo代表の相川直視(なおよし)さんにお話を伺いました。

取材
Rimo合同会社
相川直視

Rimo合同会社の代表兼エンジニア。大学卒業後、Googleに入社し、検索システムの開発に従事。その後転職し、Wantedlyの開発に参画。Wantedly Peopleアプリの開発リーダーを務める。2019年12月よりRimo合同会社を創設。(HP


大塚亜依

この記事のライター/大塚亜依

エディマグにて、インタビュー記事などを担当。ITスキルは低めだが、リモートでの取材や打ち合わせにもどうにか慣れつつあり、場所のハードルがなくなることで仕事の幅が広がることに感動を覚える日々。

1.新しい働き方をサポートするサービスを開発

新しいツールと理想の会社をつくりたくて

rimovoice

『Rimo Voice』とは?

「はたらくを未来に」を企業理念とするRimo合同会社が、2020年9月にリリースしたAIによる日本語専用の文字起こしサービス

ブラウザ上に音声または動画ファイルをアップロードすると自動で文字起こしがスタート。音声ファイルの場合、1時間のファイルの文字変換が約5分で完了。句読点も自動的に挿入され、3~5行ごとに改行して読みやすく構成してくれる。

また、文字と音声データがリンクしているのが大きな特徴。聞きたい部分をクリックすると該当箇所を聞きなおすことができる。さらに、音声データごとにURLも発行されるので、ブラウザ上で共有や文字編集が可能


大塚亜依

文字起こしは、ライターにとっては切っても切り離せない作業で、何とか効率化できないものかと長年悩んでおりまして…。Rimo Voiceを使ってみたところ、「これはいい!」と感動し、サービスの開発元であるRimoの代表である相川さんに今回インタビューをお願いさせていただきました。

まずはRimoの起業の経緯についてお聞かせください。

どうすれば多様な人が同時に楽しく働けるか」ということにずっと興味があったんです。

私は元々、新卒でGoogleに入社し、ソフトウェアエンジニアとして検索システムの開発などを担当していました。その部門は、Googleの中で最も歴史があり、「既存のシステムをどう改善するか」を探求するのが主な仕事。一方、自分は、もう少しゼロから新しい価値を提供できるものがつくりたいと思うタイプだと気づきました。そこで、2012年に転職し、Wantedlyの開発に参画しました。

顔写真
相川さん

大塚亜依

Wantedlyと言えば、求人者と求職者をマッチングする“ビジネスSNS”を展開するベンチャー企業ですよね。マザーズ上場も体験されたとか。

はい、「シゴトでココロオドル人をふやす」というミッションを掲げて、働いていました。

当時もより楽しく働ける人を増やすことができた実感はあったのですが、より新しい働き方を試し浸透させるといった挑戦は構造的に難しかったです。例えばコロナ以前の当時、リモートワークは完全に禁止でした。これはGoogleでもそうだったのですが、ベンチャー企業は投資も受けていて、成果に対するプレッシャーも大きいので、成功率を下げかねない組織上の挑戦はやりにくいんです。

そんな中で完全に自分の責任で、理想とする組織づくりに挑戦したい”という想いが強くなり、2019年12月に起業しRimoを設立。

自分で会社を興せば、生産性を保つツールをつくりながら、リモートワークの実現をはじめ、副業の人も主体的に働けて、トップダウンではない、個々の社員に意思決定権がある“ティール組織”を目指すこともできる

そういったやってみたいことが全部できるのでは、と思ったことがきっかけです。

顔写真
相川さん

議事録が文字化サービスのきっかけに

Rimoのログイン画面。Google、Facebook、Microsoftのアカウントでもログイン可能


大塚亜依

Rimo VoiceはRimo合同会社が手がけた最初のサービスだそうですね。

なぜ最初のサービスとして「文字起こし」を選ばれたのでしょうか?

新しい働き方を実現するうえで、とくに変革の必要性を感じたのが“会議”でした。

さまざまな働き方をする人たちが、全員同じ時間に同じ場所に集まって話し合うことは難しい。それならまず、オンライン会議システムをつくろうと思い立ちまして。さらに「オンラインでミーティングをすれば、議事録を自動で取れる!」とひらめいたのが、すべての始まりです。

例えば、都合で2時間のオンライン会議に参加できなかった人が、録音、録画したものをすべて視聴するのはあまり効率的ではないですよね。でも文字化するシステムがあれば、短時間で内容を共有・把握できます

リモートワークや副業、時短といった、多様な働き方を推進するツールになりうると考えました。

顔写真
相川さん

大塚亜依

なるほど!

オンライン会議を共有する議事録をつくるうえで必要になったのが、文字化のサービスということですね。

そうですね。はじめは既存の文字起こしのツールが生かせないかと、いろいろ試してみたのですが、音声や文字の検索機能などの面で満足のいく精度のものがなく、自分たちでつくってみることに。それがRimo Voiceのスタートでした。

後々には、全体のプロダクト、つまり議事録を自動で取れるオンライン会議システムをRimoという名前でリリースする計画がありまして、Rimo Voiceはその書き起こし部門になります

顔写真
相川さん

未来と今を見据えたプロダクトづくり


大塚亜依

Rimo Voiceは、議事録のほかにはどんな使われ方を想定していましたか?

ライターや編集者のニーズは想定していました。

エンジニアとして、何かプロダクトを作るときには、「どんな未来に行きつくべきなのか」をまず考えるようにしているのですが、ユーザーとして思い描く人が、利用してお金を払ってくれるとは限りません。

実際は、リモートワークをやりたい人があまり存在しないかもしれない。

であれば、「今提供できるものに一番価値を感じてくれるターゲットは?」と考えました。そこで一番に思い浮かんだのがライターでしたね。

顔写真
相川さん

大塚亜依

私も利用してすごく便利だと感じましたし、実際にライターや編集者にとって価値のあるサービスになっていると思います。

価格は音声だけだと30秒20円。1時間2400円で文字起こしができるという設定ですよね。

ライター自身が1時間の音声データを3時間かけて文字起こしする場合、時給2500円と設定すると7500円になりますよね。

その3分の1くらいの料金をいただいて、少し修正時間がかかるとしても、顧客にとってはプラスになりえるのかな、と。

顔写真
相川さん

大塚亜依

費用もさることながら、さらにインパクトがあるのは時間ですよね。

自分で1時間の音声を文字起こしするのに3時間かかるところを、わずか5分ほどでぽんっと文字で出てくるというのは驚きで、大きな利便性を感じます。

他社の文字起こしサービスと比較して、ほかに優れた点はありますか?

RIMO,rimovoice,音声検索

今回のインタビューを文字起こしした画面。正確に文字起こしできていない部分はあるものの、文字をクリックすると該当箇所の音声が流れるため、手動の修正作業がとてもスムーズ

現状文字起こしの精度も比較して高いのですが、競合するのがGoogleとかAppleとか、かなりの大手になるんです。そういった企業は、開発力も高いので、精度だけでは将来に渡って優位性を維持し続けられるかといった不安も残りました。

そこで、文字と音声データをリンクさせて、「気になった部分をすぐに聞ける」「音声を検索できる」「スマホでも使えてオンライン上で共有できるなど、プラスアルファの機能を充実させました。

あと優れている点としては、使える音声ファイルの種類が多いこと。なるべくどんな形式のデータにも対応できるよう改善を重ね、かなりの労力を注いでいます。これは悲しいかなユーザーにはあまり気づかれないんですけどね(笑)。

顔写真
相川さん

文字化がもたらす効率化や組織の透明性


大塚亜依

“新しい働き方をサポートしたい”という目的でリリースされたというRimo Voiceですが、実際に利用しているユーザーからはどういった声が届いていますか?

Rimo Voiceを実際に議事録作成に活用してくださっている日本農業協会の事例をご紹介します。

行政機関などにも提言を行っている協会で、会議においては交渉事も多く、誰が何を言ったかを記録するためにも議事録作成はかねてから大事な業務。二人がかりでメモを取り、録音もしたうえで記録をまとめ、関係者が目を通しながら修正を重ね、1週間かけて議事録を仕上げていたそうです。

労力も時間もかかることが課題でしたが、Rimo Voiceを使ったところ、格段にスムーズに内容がまとまり、2日ほどで最終版が完成したとのこと。さらに、これまで議事録を取ることに追われていた人も、会議に集中できるようになったという声をいただきました。

ほかにも、ユーザーさんの活用事例は弊社のnoteでも公開しています。

顔写真
相川さん

rimo voice

noteにてユーザーインタビュー記事を公開中


大塚亜依

なるほど。議事録をとる作業が効率化された好例ですね。

チームのコミュニケーションの効率化にもつながりそうです!

あとは、評価の面でも影響を与えられるのではと思っています。

文字化により誰がどんな発言をしたかが可視化できるので、普段は埋もれてしまっているけど会議でいい活躍をしている人が、ちゃんと評価される世の中になるかもしれない

将来的にはRimoというオンライン会議システムが、参加者の評価も自動で行う展開も考えています。「360度評価」の一助にもなり得るはずです。

顔写真
相川さん

大塚亜依

ツールをうまく用いることで、客観的な評価につなげられるかもしれませんね。

相川さんご自身はRimo Voiceをどのように活用したいですか?

Rimo Voiceの利用によって組織の透明化を目指しています。

GoogleやGitHubで行われているオープンソースと呼ばれる開発形態では、重要な意思決定がメンバーにも全て明かされて議論されます。多くの会社で従業員が経営者目線を持てないのは、知るべきことが隠されている面もあるからなんですよね。

例えば、「この時期に成長しないと先がないから、給与を十分に支払えなくても広告を出さなくては」ということが知らされないから、不満や隔たりが生まれてしまう。重要な会議ほど、オープンにするべきなんです

自社はもちろんですが、ほかの企業にも、文字化による組織情報の透明化に役立ててほしいと思っています。

顔写真
相川さん

大塚亜依

なるほど。Rimo Voiceでの書き起こしが透明化へのその第一歩になるということですね。

2.誰もが主体的に楽しく働ける会社を目指して

イラスト

副業を認めることのメリット、デメリットとは


大塚亜依

Rimo合同会社は、スタッフのほとんどが副業で勤務しているそうですね。なぜそのような形をとっているのですか?

今のところカスタマーサポートの方が一人だけ正社員で、ほかは全員副業です。この勤務形態にしているのは、それでうまくいくのか、試してみたかったというのが本音です(笑)。

ただひとつ明確なのは、AIの領域に関して言えば、普通の人がどれだけ集まっても仕方がないんです

突出したものをつくれる人が必要で、でも最初から優秀な人を高いコストをかけてフルタイムで雇う体力も勇気もない。そういった状況の中、優秀な人に週一でいいから手伝ってもらえないかという交渉をした結果、現在の雇用形態になりました。

顔写真
相川さん

大塚亜依

会社ですからいろいろな役割の人が必要だと思いますが、どのように組織されているのでしょうか?

数人のエンジニアのほか、PRやカスタマーサポート、それに法務、労務、会計士など、本来は10人ほど必要なのに、給与を払う資金は3人分ぐらいしかない…。となると最初から副業を基本にして、各々にフルタイムの5分の1ずつ働いてもらうチームを作れば、成立するわけです。

あと、やってくれた仕事の一つひとつに感謝することが多くなりました。本業の人だとどうしても仕事をして当たり前なので、それに感謝することを忘れがちですが、副業の場合は給与は払ってるとはいえ、わざわざ夜や休日の時間を使ってやってくれているので。

多くの感謝をしながら働けるって幸せなことですよ。

顔写真
相川さん

大塚亜依

なるほど。ほぼ全員が副業というスタイルのメリットとデメリットについては、どう感じていますか?

メリットは、フルタイムだけの組織が生産性を下げていた面があったことに気づけた点です。

同じ社内でも、職種によってどの時期に忙しくなるかは違います。にもかかわらず、全員がフルタイムで働く場合、たとえばPR担当者が、特に新しくPRできるものはない状況だけど何かPRしなくては、と多忙なエンジニアに情報を出してもらって余計な負担を与えてしまう、エンジニアも思いつきの新しいものを作ってみるとデザイナーに負担をかける、というようなことが起こってくる。

悲しい話ですが、自分が真面目に働いているゆえに、会社全体からしたら本来は優先度の高くない仕事をして、他の人の仕事を増やして生産性が下がってしまうわけです

顔写真
相川さん

大塚亜依

それって企業で働いている人皆が共感できる悩みかもしれません。

全員が足並みをそろえてフルタイムで働くって、本来はすごく難しいことですよね。

そうだと思いますね。

副業のスタッフが多いことのデメリットは、やはりコミュニケーションをとりづらいことでしょうか。

とくに小さい会社だと、お互いの仕事をしっかり把握していたいという欲求が出てきてしまいがちですが、そこは気にしないようにと働きかけています副業で週一勤務の人が、会社で起こったことを全て把握しようとしていたら、本来の仕事が進まない。

ただやはり、誰かは把握しておいた方がいいということで、最近のチャレンジとして、会社全体のことを把握するという役割もつくろうとしています。毎日二時間働ける人ならば、各々の進捗を含め、会社のこれからについても把握するというタスクをこなせるはずですから。

顔写真
相川さん

大塚亜依

それも副業で担ってもらうのですね。すごく興味深いチャレンジです!

進化を続け、「はたらくを未来に」を実現するために

RIMO,RimoVoice,話者の設定

Rimo Voiceの画面。現状は改行および手動で各文章に話者を設定することができる


大塚亜依

今後、Rimo Voiceはどのように進化していくのでしょうか?

個人的には誰が話したかの特定を自動でしてくれるようになると、さらに便利になるように感じているのですが。

話者分離はすごく難しいんです。現在は手動で話者の名前を設定する形になっていて、機械学習モデルの問題上、複数人で同時に話されるとテキスト化できないことも。人間だって大人数で話す場合、誰の声か聞き分けることが実はできていないかもしれませんよね。

でもオンライン会議システムのRimoがリリースされれば、マイクが別々なので誰が何を話したかを特定できます自動で複数人の声をそれぞれ分けて、書き起こせるようにしていきたいですね

それと、今、検討しているのは重要な部分の抽出です。

会議の内容を要約するとなると難しいのですが、「重要だったところを箇条書きで3か所だけ抜き出すとしたら?」ということなら可能では、と準備中です。

顔写真
相川さん

大塚亜依

重要部分の抽出があれば、さらに共有の効率化が進みそうですね!

最後に、会社としての展望をお聞かせください。

「はたらくを未来に」という理念を軸に、思い描く組織づくりを粛々と進めていきたいです。まだまだ途中の段階なので、一歩ずつがんばります。

あと、他社から「何か一緒にやりましょう」とお声がけいただくことも多く、副業ばかりの組織ゆえに協業もしやすいので、そういうセレンディピティを楽しみながら、自分たちの仕事にしっかり取り組んでいけたらいいですね

Rimo Voiceの改善も重ねていきます。チャットツールを活用してユーザーの質問や不具合には全部僕が応えるようにしているので、どんなことでも気軽にお問い合わせいただけたらうれしいです。

お客さんの声を聞き続けるということは、とくに大事にしていきたいですね。

顔写真
相川さん

大塚亜依

RimoさんとRimo Voiceのこれからに期待しています!

今日は興味深いお話をありがとうございました。

3.文字化サービスで新しい働き方をサポートしつつ、自ら柔軟な仕事スタイルを実現

rimo

開発中のRimoによる議事録作成のイメージ

Rimo 合同会社が第一弾のプロダクトとしてリリースしたAI文字起こしサービスRimo Voice。

ライターや編集者にとっては何ともありがたいツールですが、目指すのは単なる文字起こしサービスではありません。「人々の働き方を変える手助けをしたいというのが開発者である相川さんの想い

リモートなど新しい働き方を阻む原因としてツール不足を認識し、ひらめいたのが「議事録を自動で作成可能にすること」でした。

オンライン会議の内容を自動でテキスト化できれば、議事録を作成する手間を軽減できるだけでなく、別の場所で働くスタッフへの共有もぐんとスムーズになり、働き方を広げられると考えたのです。

ただ文字化するだけでなく、文字と音声データをリンクさせるのもRimo Voiceの利点。話者のニュアンスや温度感も含めて内容をシェアすることができ、リモートワークや副業を導入する企業の心強い助けになってくれるはずです。いずれはスタッフの評価を自動で行ったり、組織の透明化につなげることも目指しており、さらなる可能性に満ちています。

キャリアを重ねる中で、働き方に関心を持つようになったという相川さん。「生産性を保てるツールを開発しながら、理想の組織を作ってみたい」と、Rimo合同会社を立ち上げました。

メンバーのほとんどが副業というスタイルでも、各々のスキルや経験を最大限に生かして品質の高いサービスを生み出しています。効率よく、生産性の高い働き方ができるのが副業ならではのメリット。会社のすべてを把握できていなくても、自分が何をするべきか、それがどんな価値を生み出すかを、各々が把握して仕事をすることを徹底していると言います。

会社の理念は「はたらくを未来に」。

Rimo Voiceは、現在進行形で新しい働き方を実践する組織の中でこそ生まれたサービスであり、これからも進化し続けていくのでしょう。

4.終わりに

リモートで行った本取材。画面に現れた相川さんは、山々に囲まれた屋外にいらっしゃいました。聞けばワーケーション中で北軽井沢に滞在されているとのこと…!そのキャリアを聞くに、さぞかし自由で先進的な働き方をしてきたのではと思いきや、実際はそうではなく、前職では家庭の事情でリモートワークを望む部下に応えてあげられないのがつらかったと言います。

「ならば自分で理想の組織を作ろう」と思い立ち、それを叶えるためのツールも自分で作ればいいのだ!と起業に至ったというお話にほれぼれしました。根っこにあるのは「もっと楽しく働きたい」という想い。

そんな相川さんが起業後初めて開発したRimo Voice。私も実際に使わせてもらいました。

まず驚かされるのが、文字化の迅速さ。1時間のインタビューが5分そこそこですべてテキストデータに変換され、まるで魔法のよう…!もちろん完璧とはいかないので音声を聞き直しつつ、テキストを手直ししていくのですが、音声と文字がリンクしており、ブラウザ上で編集していける仕組みなので、とってもスムーズ。そして何だか楽しい。最新のAI技術を使いこなして(?)いることに、心地よい興奮を覚えつつ、「ああAIって、本当に人の仕事を助けてくれるんだ!」とこれほど実感したこともありませんでした。

そして、聞けば聞くほど単なる文字起こしサービスを超えて様々な可能性を感じさせてくれました。

ひとつのツールが、人の働き方や価値観を変えることだってありうるのですね。これからの進化が楽しみです!

イラスト=キタハラケンタ

AI OTSUKA

この記事の執筆者AI OTSUKAライター・編集者

和歌山生まれ、おもに名古屋育ち。名古屋大学在学中、地理学を専攻してフィールドワークを学び、各地で「高齢者の余暇活動」をテーマに調査研究。生涯を通じて余暇を楽しむことの大切さ、人に話を聞いて文章で伝えることの面白さを実感し、編集の道へ。東京の編集プロダクションなどで約6年間、おもにタウン誌の制作に携わる。その後、名古屋へ戻り約8年間、エディマートに勤務。30代までの仕事に燃えた日々は一生の財産! 出産を経て、フリーのライター・編集者として再スタート。仕事と子育てと家事、家族と過ごす時間とひとり時間。ほどよいバランスを見つけようと試行錯誤の日々。

記事一覧

お問い合わせ

お仕事のご相談や、採用についてなど、
お気軽にお問い合わせください。