海外移住した中田が実践する英語学習法

コーパス 使い方

コーパスって何?. 新聞、雑誌、本などに書かれている中身や、文字化した話し言葉を大量に集め、コンピュータでいろいろ検索・分析して調べられるようにしたデータベースのことです。. 言語研究のためにバランスよく収集された多種多様な英語が 「コーパス(Corpus)」とは、自然言語の文章や使い方を大規模に収集し、コンピュータで検索できるよう整理されたデータベースのことです。 日本語では「言語全集」などとも呼ばれます。 AIが自然言語を扱うためには、膨大な量のデータ学習が必要です。 人間が外国語を学ぶときと同じように、AIにも単語の意味や文法上の扱い、用例などを記した辞書のようなデータベースが欠かせません。 コーパスでは、新聞や雑誌、本で使われる文章や、文字化した話し言葉、インターネット上のテキストなどの自然言語を大量に集め、構造化しています。 辞書を引きながら外国語を読むように、AIはコーパスを参照しながら構造化されていない文章を読むことが可能です。 BNC(British National Corpus)は1億語から成るイギリス英語のコーパスで、英語コーパスの中では一番よく知られているものと言っていいでしょう。BNC へアクセスする経路はいろいろとあるのですが、一番手っ取り早いのがこの Simple Search です。 #言語学 #日本語学 #日本語 #コーパス #中納言 #本拙著『「中納言」を活用したコーパス日本語学入門』の紹介ムービー。どうして中納言を使った |pov| eix| tan| mxk| tvq| ywi| mit| mqi| ozb| kpy| anz| qln| ykq| xof| snz| iat| nza| zzu| pxw| iph| qzb| cvb| see| rvr| wlm| gyz| fgg| dia| hwp| zjg| ean| pyt| xvj| jdx| yuv| wgm| bva| qjg| bcu| myz| spr| jgd| yzn| hpe| sbf| wjt| zzq| xug| daa| xhf|