読者です 読者をやめる 読者になる 読者になる

AIプログラムとかUnityゲーム開発について

探索や学習などを活用したAI系ゲームを作りたいと思います。

自然言語処理

単語の意味を列挙する

いっぱい意味がありますねw I love you love = 【名-1】愛、愛情 【名-2】恋、恋愛 【名-3】いとしい人、恋人 【名-4】情事、セックス 【名-5】愛着、愛好 【名-6】大好きなもの、愛着があるもの 【名-7】〔恋人などのへ呼び掛け語の〕あなた、おまえ 【名-…

英辞郎辞書から熟語を含む単語列を検索

austere budget Augustow audio-frequency amplifier austere budget = 緊縮予算 Augustow = 【地名】アウグスツフ audio-frequency amplifier = 可聴周波数増幅器いわゆる最長一致法的に検索したいとして、熟語と単語が混在してるとややこしいね。 全組み合…

英辞郎CD-ROMからテキストデータを抽出

ブックオフに英辞郎第四版が200円で売っていたので購入。 CD-ROMから英辞郎をインストールして、テキストの辞書を抽出してみました。 PDIC一行形式を選んで変換すると以下の様な大量なデータが抽出出来ました。 (CSV形式とPDIC一行形式の違いがよく解り…

文をベクトルで表現する

潜在的意味インデキシング(LSI)徹底入門 - あらびき日記上記で紹介されていたサンプルを動かしてみました。 Rで書かれたスクリプトです。 d1: 会場には車で行きます。 d2: 会場には自動車で行きます。 d3: 会場には自転車で行きます。 d4: お店には自転車…

IBM Model 1 ' word based model'

統計的機械翻訳のはじめの1歩のIBM model1を試してみました。 本当は論文読んで自分で実装できれば良かったんですが、数式が難しく、ましてやコードにするのは今のところ無理ですんで、検索しまくってサンプルを見つけましたy-uti.hatenablog.jp 上記のpyth…

mecabのユーザー辞書にwikipediaの見出しを登録する

以下を参考にwikipediaの見出しをmecabのユーザー辞書に登録してみます。 aidiary.hatenablog.comwikipediaからの見出しをdownloadします。 wcで数えると見出しは1594901個ありました。159万です、多いね。上記記事で紹介されているpythonコードを実行を使わ…

文章中の単語の共起回数を数える

http://rafeel.s602.xrea.com/honyaku/mecab.cgi 先ほどの形態素解析のテスト用の文章を利用して、1文毎に形態素の共起回数を数えてみました。 なにぶん14文ですので、単語の出現数も共起数も少ないですが以下の様な感じに。マクドナルドの話なので、そっ…

xreaでperlでmecabを使う

以下を見るとxreaにはmecabがインストールされているらしい。somenotes.seesaa.netperlなので、 qiita.com上記を参考に動かしてみた。 動いた! 無料版xreaなのでダメかなと思い込んでた。http://rafeel.s602.xrea.com/honyaku/mecab.cgi 浜松駅の耐震工事の…

対話システム

昔、人工無能的なものを作ったことはある。入力された文章に適当なキーワードをひっかけて、あらかじめ返答を用意しておくもので、 大量にルールを作れば、それなりに会話ができるが、キーワード抽出には副作用もあり、否定が区別できないと、まったく逆にと…

単純な機械翻訳3 コロケーション

単純なコロケーションを入れてみました ピアノ 引く サッカー する ゲーム 遊ぶ原文:I play the game.http://rafeel.s602.xrea.com/honyaku/?q=I+play+the+game. collocation sort (私はゲーム遊ぶ:st) (1) (私はそのゲーム遊ぶ:st) (1) (私試合ゲーム:n) (0…

単純な機械翻訳2

原文:This pond freezes in the winter.辞書を増やせばいくらでも語彙が増えるけど、それは本質ではないですが。 theとかfreezeに意味の揺れがあるので、探索空間は前回よりは増えるhttp://rafeel.s602.xrea.com/honyaku/?q=This+pond+freezes+in+the+winter…

単純な機械翻訳

かなーりブログ更新してませんでした。 しばらくUnity触ってないので、ちょっと遊びで機械翻訳をperlでやってみます。30年ぐらい前の技術だと、機械翻訳は、単語を置き換えて、品詞を特定し、品詞にそって構文をとり、構文ルールに則って並べ替えを行って機…