話題のまとめニュース

ネットで話題のニュースをまとめました!

【AI】マイクロソフトの音声認識システム、「人と同等」レベルに到達

   

1 :スタス ★:2017/08/24(木) 20:35:58.22 ID:CAP_USER9.net
マイクロソフトの音声認識システム、「人と同等」レベルに到達
2017年08月24日 13時18分
https://m.japan.cnet.com/story/35106247/

 Microsoftの研究員が開発した音声認識システムが、人間の速記者と同レベルとされる単語誤り率を達成した。

 Microsoftは米国時間8月21日、同社の音声認識システムが、プロの速記者に匹敵するとされる5.1%の単語誤り率に達したと発表した。

IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断

IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断
 Microsoftは2016年、5.9%の単語誤り率で「ヒューマンパリティ(人間と同程度)」に到達したと考えたが、IBMの研究員らは、そこまでのレベルに達したとするには、IBMの最高記録である5.5%をやや上回る5.1%に達する必要があると主張した。

 IBMが実施した速記者に関する研究では、数人に会話を何回か聞いてもらい、もっとも優秀な速記者の結果が選ばれた。

 Microsoftのシステムは、2016年のテストと同様に、データセット「Switchboard」コーパスを使って測定された。Switchboardコーパスは、見知らぬ者同士が電話越しに米国英語で交わした約2400の双方向の会話から成るデータセットだ。このテストは、スポーツから政治までさまざまなテーマについて交わされた会話を文字化するものだ。

 MicrosoftのテクニカルフェローであるXuedong Huang氏は、次のように述べている。「音響モデリングを改善するため、CNN-BLSTM(Convolutional Neural Network combined with Bidirectional Long-Short-Term Memory:畳み込みニューラルネットワークと双方向長短期記憶の組み合わせ)モデルを追加した。また、複数の音響モデルに基づく予測を組み合わせるアプローチを、フレーム/セノンレベルと単語レベルの両方で取り入れた」

 「さらに、会話セッションの全履歴を使って、会話の次の流れを予測させた。これによって、音声認識システムの言語モデルが強化され、会話のテーマやその場の文脈に有効に適応できるようになった」

 重要な節目を迎えたものの、Microsoftは、さまざまな訛りや話し方を認識するのが機械にはまだ難しく、騒がしい環境ではパフォーマンスが良くないと認めている。

 Microsoftは、文脈を検知して会話をこれまでより正確に文字化するようモデルをトレーニングすることに成功したが、会話の意味を実際に理解するようコンピュータをトレーニングできるまでには、長い道のりがある。

20 :名無しさん@1周年:2017/08/24(木) 21:01:40.67 ID:zZDjQPw/0.net

「回転数落とし声」が得意な友人が色々挑戦したがっているんだが

21 :名無しさん@1周年:2017/08/24(木) 21:11:18.19 ID:+ipdQZGh0.net

スレに言論統制かけはじめた?

28 :名無しさん@1周年:2017/08/24(木) 21:37:55.23 ID:BJRDic1j0.net

でも空耳はするのだろう?

56 :名無しさん@1周年:2017/08/25(金) 01:35:41.70 ID:1zznGg9n0.net

MSがAI完成させたらPCレイプしまくるんだろうな

33 :名無しさん@1周年:2017/08/24(木) 22:04:07.92 ID:pKCowPxC0.net

もう日本のIT企業は蚊帳の外だな

76 :名無しさん@1周年:2017/08/25(金) 08:42:24.66 ID:Gv8lfnR40.net

ビートたけしや長州力がなに言ってるかわかれば本物

92 :名無しさん@1周年:2017/08/25(金) 13:32:35.41 ID:iE1pCtwL0.net

ちむじゅらさん ゆんたく でぃきやー

同じ日本人でも分からなかったりするわけだどな

85 :名無しさん@1周年:2017/08/25(金) 10:08:46.78 ID:ZzKC/hs/0.net

近いうちに通訳の職が奪われるね

英語教師も仕事がなくなるだろうな

今必死で子供に英語習わせている母親涙目だろう。
というか気付いてないか。

46 :名無しさん@1周年:2017/08/24(木) 23:19:46.31 ID:bwRmr7zX0.net

>>32
目は口ほどにものを言う
ぐらいに到達したらすごい

16 :名無しさん@1周年:2017/08/24(木) 20:43:23.11 ID:zz29Klrf0.net

🐒

70 :名無しさん@1周年:2017/08/25(金) 08:16:36.13 ID:7r0NwYjR0.net

>>67
結局は、人間ができる程度にはなるだろうね。
それはいわゆるシンギュラリティとか以前に。

4 :名無しさん@1周年:2017/08/24(木) 20:39:27.63 ID:cHadeoTN0.net

🐒

18 :名無しさん@1周年:2017/08/24(木) 20:45:34.98 ID:P0JO9eD40.net

これで菅野美穂の謎が解けるな

35 :名無しさん@1周年:2017/08/24(木) 22:18:09.34 ID:9R8jE8ou0.net

59 :名無しさん@1周年:2017/08/25(金) 02:00:02.70 ID:/ryrBPsL0.net

やりたい

この意味を認識出来ないだろうな

14 :名無しさん@1周年:2017/08/24(木) 20:42:16.53 ID:zcv3moy00.net

🐒

75 :名無しさん@1周年:2017/08/25(金) 08:35:31.21 ID:8/ISWOyp0.net

コンタナさんは?

95 :名無しさん@13周年:2017/08/25(金) 18:32:38.43 ID:AvldHGkPX

昔、神が罰として人類の言語を分けたのに
AIはそれを問題ない水準にまで補助できるようになるわけだな。

31 :名無しさん@1周年:2017/08/24(木) 21:55:59.44 ID:TNx6bZRV0.net

googleのも結構聞き分けてるけどな
だがsiriお前はダメだ。二言目には「何を言っているのかよくわかりません」とか言いやがって。
間違いなくこの分野でappleは出遅れている。

82 :名無しさん@1周年:2017/08/25(金) 10:06:54.61 ID:5IEIlxn10.net

ユーザー「おい、エロ動画探して来い
Windows「認識できません、もう一度お願いします
ユーザー「エロ動画探して来いって言ってんだろ!
Windows「認識できません、もう一度お願いします
ユーザー「ロリ動画早く持って来いよ!
Windows「通報しました

78 :名無しさん@1周年:2017/08/25(金) 09:52:43.79 ID:+U7CfJ410.net

人がAIレベルになっただけ

83 :名無しさん@1周年:2017/08/25(金) 10:07:02.77 ID:ThCoHTgY0.net

でもさ人間の場合は「クンニ派」と聞こえても、こいつはこういうこと言うやつじゃないなたぶんスンニ派だろうな
って思考が働くけど、AIってそこまで考えられるの?

71 :名無しさん@1周年:2017/08/25(金) 08:19:20.51 ID:SZ84sW620.net

>>44
終焉じゃないわ
未開

36 :名無しさん@1周年:2017/08/24(木) 22:27:10.24 ID:Hk2HqYl60.net

ズーズー弁認識してちょ

90 :名無しさん@1周年:2017/08/25(金) 11:54:24.52 ID:gxIY9hRq0.net

>>88
なぜその例で納得させられると思ったのかw

55 :名無しさん@1周年:2017/08/25(金) 01:01:30.37 ID:idc+0fai0.net

りんなも、もはや人と同等

30 :名無しさん@13周年:2017/08/24(木) 22:01:48.60 ID:Fl7m+1rd1

大分進化したんだなあ

84 :名無しさん@1周年:2017/08/25(金) 10:08:14.68 ID:yxSQ/wYY0.net

天龍声なのでこの手のソフトは全く認識されない

52 :名無しさん@1周年:2017/08/24(木) 23:59:06.80 ID:Lyb1Sl650.net

一音一音はっきり発音する日本語のほうが
向いてるんじゃないの

81 :名無しさん@1周年:2017/08/25(金) 10:02:19.84 ID:IGFlbgTr0.net

空耳ストw




 - ニュース