忍者ブログ
2024.04│ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
zkunがいろんなことを横書きするブログのようですw(含み笑)
2024年04月29日 (Mon)
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

2015年07月25日 (Sat)
v007が出たようですw 最近は朝起きたらGhostをいじって、午前中に完成、というパターンで、午前中のフレッシュな脳でプログラミングをする生活サイクルが確立してきているようですw 帰宅後の疲れた脳でやるより効率もいいし、出発直前の時間に余裕のない状況でやるとイライラばかりつのるので、朝早くから着手するというのは理想的であるとわかったようですw 気温もまだ高くないので快適ですしne 問題は、夜から深夜にかけて仕事中眠くなりやすいということですが、まあ、仕事のほうはやる気が失せてきているので、多少居眠りしてるくらいでも大丈夫でしょうw(失笑)

今回は、格助詞で「を」と「の」が選ばれたときにフラグを立て、「を」なら他動詞グループへ直行させ、「の」なら一般名詞グループへ直行させるように設定してみました。必ずしも日本語文法では直行しないといけないわけではありませんが、とりあえず確実に不自然さを解消する効果があるので、ここではこのように設定してみたようですw(強引な笑)

さらに、文章中で「わたし」と言ったり「ぼく」と言ったり、コロコロと人称代名詞が変わるのはおかしいので、1人称はこれ、2人称はこれ、と文章中で統一する機構も作成しましたw まあ、これは例外なく統一性があるべきものなので、妥当なようですw

そんな感じで、意味的にはシュールな文も連発しますが、文法的にはだいぶこなれてきたようなので、そろそろ、単語の自動解析部分の作成に着手する段階に来たかなと思うようですw 目標としては、『青空文庫』からコピーした作品テキストを丸ごと読み込ませて、それ全体を解析して辞書を作成し、その作品の用語や文体に準じた、似て非なる類似文章を生成しちゃうところをゴールとしますが、まずはもっと身近な、ネット上のニュース記事なんかを材料にして、似て非なる文章を自動生成するところから着手していこうと思うようですw ヤフーニュースの文章をまるごとコピペして、まずは不要な括弧内注釈などを除外し、すっきりした文章にととのえて、主に漢字、かなの変わり目を目安にして、切り取っていきますw そこで、どのようなルールで切り取り、それをどのグループへ分類できるのか、というところが、解析ルーチンの最大のキモとなるところでしょうne 判定のしようがないものは「ボツ」にすることで、辞書グループに「使えない」ゴミ単語が蓄積されないよう判断するルーチンも重要なようですw(高度な笑) また、助詞、助動詞、代名詞などの数が限られている品詞については、あらかじめそれらの出現パターンと形が推測できるので、先回りした待ち伏せスクリプトを張っておくことも可能でしょうw それらをいきなりからすべて網羅するのはたいへんなので、これも段階を踏んで、ちょっとずつ実装していくかたちで完成度を高めていこうと思うようですw 有言実行のzkunは、やると言ったことはほぼほぼその通りに実現していく人物なので、このGhostも完成したら凄いことになりそうな気がするようですw(含み笑)

拍手[0回]

PR
←No.499No.498No.497No.496No.495No.494No.493No.492No.491No.490No.489
カレンダー
03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
フリーエリア
Free counters!
最新CM
[05/13 ズーム君]
[05/13 yt]
[05/13 yt]
[05/03 yt]
[04/29 ズーム君]
最新TB
プロフィール
HN:
zkun
性別:
男性
ブログ内検索