□投稿者/ ONnoji -(2024/02/20(Tue) 14:17:38)
| 2024/02/20(Tue) 15:15:37 編集(投稿者)
> Windows10で桐10sを使用しています。 > 桐10sで環境依存文字を含むデータ行をみつける良い方法はないでしょうか? > 後の作業で文字化けが起こったりするため防ぐ方法があればアドバイスいただけますか?
ひょっとして、次の過去ログが参考になるかもしれませんが・・・???
こちら ↓ 過去ログ90 ■13397 / inTopicNo.1) unicode が含まれるデータの抽出について http://tayu.o0o0.jp/bbs/kiri/cbbs.cgi?mode=al2&namber=13397&no=0&KLOG=90
> ■13397 / inTopicNo.1) unicode が含まれるデータの抽出について > □投稿者/ きりこ -(2022/07/27(Wed) 12:10:56) > 絞り込みの事でお伺い出来たらと思います。 > > エクセルやUTF-8のCSVを桐に読込後、項目内のunicodeの含まれるデータを > 絞り込みしたい場合、どのような関数を使用すればよいのでしょうか。 > > 例えば記号を含むデータを絞り込む場合は > > #is記号([],0)>0 > > 等で対応できましたが、そのような関数を探してみましたがありませんでした。 > S-JISのCSVにして「?」をサーチするのも大変なのでお分かりになる方が > いらっしゃればご教授願いたいと思います。
p.s.
ご案内した過去ログは長いので非常に分かりにくいですが、
結論を申し上げると、「シフトJISとして扱えない文字を調べる」という内容ですよ。 ・・・・・・・・・・・・・・・・・・・・・
「シフトJISとして扱えない文字」イコール「環境依存文字」という図式ですね。(^^ゞ
> ■13411 / inTopicNo.13) Re[7]: unicode が含まれるデータの抽出について > □投稿者/ ONnoji -(2022/07/28(Thu) 13:32:03) >> 桐10では「𠮷」(吉の上が土)や「𦚰」(脇の力が刀)等の >> 環境依存文字と言われているデータをまとめて抽出する事が出来なくて >> 頭を悩ましております。 > > なるほど!、環境依存文字なんね。早く言ってよぉ〜(@_@) > > 最初から入力しないのが一番なんですけれど、こればっかりはどうにもなりそうにないですね。 > > 確かめたところ、やはりシフトJISで扱うと豆腐( "□" )ですね。 > > 手間でしょうけれども、簡単な手続きを作って実行すれば、検出可能ですね。 > > 先頭から終端まで順番に移動するループ内で、文字列の項目の先頭文字から順番に1文字ずつ調べるだけです。 > > 文字数やレコード数が多いと時間がかかるでしょうけれど・・・
|
|