■13411 / ) |
Re[7]: unicode が含まれるデータの抽出について
|
□投稿者/ ONnoji -(2022/07/28(Thu) 13:32:03)
| > 桐10では「𠮷」(吉の上が土)や「𦚰」(脇の力が刀)等の > 環境依存文字と言われているデータをまとめて抽出する事が出来なくて > 頭を悩ましております。
なるほど!、環境依存文字なんね。早く言ってよぉ〜(@_@)
最初から入力しないのが一番なんですけれど、こればっかりはどうにもなりそうにないですね。
確かめたところ、やはりシフトJISで扱うと豆腐( "□" )ですね。
手間でしょうけれども、簡単な手続きを作って実行すれば、検出可能ですね。
先頭から終端まで順番に移動するループ内で、文字列の項目の先頭文字から順番に1文字ずつ調べるだけです。
文字数やレコード数が多いと時間がかかるでしょうけれど・・・
|
|