「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。

-戻る
--[[言語処理]] > [[機械翻訳]]
--[[動画関連]]、[[翻訳関連]] > [[動画音声の翻訳]]
--[[動画関連]]、[[翻訳関連]]
---Google翻訳
---[[DeepL翻訳]]
---[[動画音声の翻訳]]

*目次 [#t6fbd44e]
#contents

*概要 [#ddb1f8b4]
https://translate.google.com/

**歴史 [#ub0f0a82]

***最初は、 [#de2ae5e0]
-他のサービスと異なり、独自のフレーズベース[[統計的機械翻訳(SMT)>機械翻訳#m53ddda3]]を用いていた。

-200億程度の語から成る国際連合の[[バイリンガル・コーパス(二言語対訳集)>機械翻訳#tcfae899]]を用いていた。

-リリース当初は
--英語からアラビア語、中国語、ロシア語からの翻訳で開始された。
--「なんか思っていたのとは違う」といった、ぎこちない翻訳も多かった。
--明らかにおかしい翻訳内容はTwitterで話題になることもあった。

-そんな状況を、2016年に採用した[[ニューラルネットワーク]]に基づく機械翻訳が一気に打破した。

--Googleとしては試験運用期間を経てから、正式に[[ニューラルネットワーク]]に基づく機械翻訳の導入を発表するつもりだった。
--ところが、ユーザーがいち早く気づき、2016/11頃から、Twitterなどで「翻訳の質が良くなっている」と騒ぎ始めた。

***現在は(2016)、 [#q8fe5f7d]
-[[ニューラル機械翻訳(NMT)>機械翻訳#m65ab882]]に変更され精度が向上。
-世界の103言語に対応しネット上で使用されている言語の99%をカバー。

**特徴 [#lb8dab14]

***PBMT [#we5f80cf]
当初のGoogle 翻訳は[[統計的機械翻訳(SMT)>機械翻訳#m53ddda3]]の~
Phrase-Based Machine Translation(PBMT)

-単語や句の訳は得意
-語順も文法も異なる言語間の翻訳が苦手~
「どんな順番で一文にすればいいのか」が難問

***GNMT [#o75aea0b]
2016年に、[[ニューラル機械翻訳(NMT)>機械翻訳#m65ab882]]の~
Google Neural Machine Translation(GNMT)を採用。

-文章全体をみて訳すので文脈に沿った翻訳ができる。
-誤りを平均60%低減させるなどの結果を見せた。

-[[バイリンガル・コーパス(二言語対訳集)>機械翻訳#tcfae899]]があまりなくても、上手く翻訳できる。
--例えば、[[半教師学習>機械学習(machine learning)#cdebd400]]的に、日本語←・→韓国語(英語←・→日本語、英語←・→韓国語)を学習
--(・)は「interlingua(インターリングア=中間言語)」と呼ばれる。
--「ゼロショット学習」と「転移学習」という2つの学習手法を使っている。

-翻訳の難点である、「ユーザーが置かれている状況次第で~
ネットスラング、尊敬語、丁寧語など語の意味合いが変わる点」には未対応

*詳細 [#t99c0b1b]

**機能 [#pc26a520]

***テキスト機械翻訳 [#rd3e6650]
-書き言葉翻訳
-ウェブサイト翻訳
-ドキュメント翻訳
-モバイルアプリ翻訳
-バイリンガル会話翻訳

***[[音声処理]]連携系 [#uc408235]
音声認識と[[テキスト機械翻訳>#rd3e6650]]の連携

-音声翻訳
-[[動画の音声を機械翻訳させる方法>動画音声の翻訳#x4e544b1]]

***[[画像認識>画像処理とコンピュータビジョン#v638f1a5]](OCR)連携系 [#mbab9709]
OCRと[[テキスト機械翻訳>#rd3e6650]]の連携

-スマホ・アプリの[[Google翻訳]]の「カメラ」(Google Lens) → 「画像」に実装されている。

-Chromeのコンテキスト・メニューからもGoogleレンズで画像検索できる。
--基本は画像を右クリックして「Googleで画像を検索」を選択すると当該画像を画像検索
--HTML部分を右クリックして「検索した画像領域を選択してください。」を選択しDrag & Dropで範囲選択すると選択範囲を画像検索
--ここには、「検索」・「テキスト」・「翻訳」のメニューがあり、メニュー毎にやれることが異なる。 
---検索:類似画像が掲載されているサイトの検索、 
---テキスト:OCRでテキストの選択(からのコピー読み上げ、翻訳) 
---翻訳:OCRテキストの翻訳「テキストを抽出して翻訳」&「翻訳結果を画像中に埋め込んで表示」が同時に行われる 

*参考 [#j7eaa11c]
-Google 翻訳 - Wikipedia~
https://ja.wikipedia.org/wiki/Google_%E7%BF%BB%E8%A8%B3

-Google Japan Blog: Google 翻訳が進化しました。~
https://japan.googleblog.com/2016/11/google.html

-「ぎこちない翻訳」から進化を遂げたGoogle 翻訳~
開発者が語る“完璧”を目指す質の追求 | DIAMOND SIGNAL~
https://signal.diamond.jp/articles/-/953

-なぜGoogle翻訳は賢くなれたのか~
ITはみ出しコラム - ITmedia PC USER~
https://www.itmedia.co.jp/pcuser/articles/1611/27/news012.html

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS