【前処理】の中で、【語の取捨選択】の機能が使えない。 #1244
-
お使いのKH Coderのバージョン3.Beta.0 8 エラー・不具合について詳しくお書きください■お使いのOS ■KH Coderのインストール先フォルダ(解凍先フォルダ) ■どんなエラー・不具合・問題ですか? ■その問題はチュートリアルの漱石「こころ」データでも同様に発生しましたか? ■分析しようとしているのは何語のテキストですか? ■分析対象として指定しているファイルの形式は何ですか? ■お使いのセキュリティ対策/ウイルス対策ソフトウェア コンソール・ウィンドウの表示内容(Macではターミナルの表示内容)を貼り付けてくださいEncoding of this Console: cp936
Encoding of this file system: cp936
This is KH Coder 3.Beta.08a on MSWin32.
CWD: C:/KHCoderOfficialPackage
Available Physical Memory: 2047MB
Checking MySQL connection...
Starting MySQL...
2024-03-25 19:25:34 0 [Note] bin\mysqld (mysqld 5.6.39-log) starting as process 29400 ...
R Version: 3.1, x86_64
Using un-threaded functions...
Monitors: 0, 1536, 0, 864 : -1920, 0, 1, 1081
new window: 343, 314
new window: 112, 135
Connected to MySQL 5.6, khc4.
MySQL integrity check: pass, c:/khcoderofficialpackage/dep/mysql
Checking icode (jp3)... utf8
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 2.
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 10.
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 12.
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 16.
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 25.
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 25.
"\x{301c}" does not map to cp932 at /<C:\KHCoderOfficialPackage\kh_coder.exe>kh_dictio.pm line 698, <SOURCE> line 27.
Morpho1 0 wallclock secs ( 0.08 usr + 0.00 sys = 0.08 CPU)
Single row: 340 bytes
The HEAP table will eat approx. 6MB; We have 1547MB max.
Read 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
Format 1 wallclock secs ( 0.08 usr + 0.00 sys = 0.08 CPU)
Strat1 1 wallclock secs ( 0.11 usr + 0.02 sys = 0.13 CPU)
Strat2 0 wallclock secs ( 0.01 usr + 0.00 sys = 0.01 CPU)
RawTXT 0 wallclock secs ( 0.06 usr + 0.06 sys = 0.13 CPU)
df: heap df: heap df: heap df 1 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
fc 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
Check 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
fix_morpho 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
fix_unknown 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
fix_headings 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
make_cache 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
clear_tmp 0 wallclock secs ( 0.00 usr + 0.00 sys = 0.00 CPU)
MySQL: FLUSH
Morpho File: C:/Users/Public/AppData/KHCoder3/khc4/khc4_ch.txt
Checking icode (jp3)... utf8 |
Beta Was this translation helpful? Give feedback.
Replies: 6 comments 9 replies
-
たしかに文字化けしていますね。その状態で「前処理の実行」をすると、強制抽出は行なわれていますでしょうか。 漱石『こころ』の方で、強制抽出が行なわれていれば、以下のように「タグ」という品詞名で「好き」という語が抽出されます。 |
Beta Was this translation helpful? Give feedback.
-
それからWindowsの言語の設定ですが、デフォルトの「日本語」から変更なさっていたりしますでしょうか? たとえば以下の画面の設定はデフォルトの「日本語」のままでしょうか? (この画面は次のようにたどると開きます:設定→時刻と言語→言語→管理用の言語の設定) |
Beta Was this translation helpful? Give feedback.
-
Beta Was this translation helpful? Give feedback.
-
「語の取捨選択」画面への日本語入力が上手くいかないということですね。それでは、ファイルから読み込むのではいかがでしょう。 このテキストファイルには「好き」と入力されています。このファイルをダウンロードしてください。そして『こころ』データで、「語の取捨選択」画面の、「強制抽出」の下の方で「ファイルから読み込み」を選択し、このテキストファイルを指定してください。 それから「前処理の実行」をすると、「好き」が「タグ」にならないでしょうか? |
Beta Was this translation helpful? Give feedback.
-
状況をお知らせいただき、大変ありがとうございます。 現在のStarting Edition(無料版)では、非日本語環境において「語の取捨選択」画面から日本語を入力・保存できないようです。この問題は今後修正したいと思いますが、しばらく期間を要すると思います。(2022/04/07追記:修正完了しました) 一方、ご自身のデータでは1語しか強制抽出できないのは、Starting Edition(無料版)の正常な動作です。 フル機能版(Base Edtion以上)をご購入いただくと、何語でも指定できますし、「ファイルから読み込み」も指定できます。おそらくですが、フル機能版(Base Edtion以上)では、画面上での強制抽出の指定も可能であろうと思います。 |
Beta Was this translation helpful? Give feedback.
-
この問題は数日前に修正されました。現在のStarting Edition(無料版)では、非日本語環境でも、「語の取捨選択」画面から日本語を入力・保存できるようになりました。お知らせありがとうございました。 なおBase Edition以上では、もともとこの問題は発生していないはずです。 |
Beta Was this translation helpful? Give feedback.
状況をお知らせいただき、大変ありがとうございます。
現在のStarting Edition(無料版)では、非日本語環境において「語の取捨選択」画面から日本語を入力・保存できないようです。この問題は今後修正したいと思いますが、しばらく期間を要すると思います。(2022/04/07追記:修正完了しました)
一方、ご自身のデータでは1語しか強制抽出できないのは、Starting Edition(無料版)の正常な動作です。
フル機能版(Base Edtion以上)をご購入いただくと、何語でも指定できますし、「ファイルから読み込み」も指定できます。おそらくですが、フル機能版(Base Edtion以上)では、画面上での強制抽出の指定も可能であろうと思います。