HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 ファイル一覧 検索 過去ログ

■14171 / 2階層)  環境依存文字
□投稿者/ とし -(2024/02/20(Tue) 15:47:27)
    No14170に返信(ONnojiさんの記事)
    > 2024/02/20(Tue) 15:15:37 編集(投稿者)
    >
    >>Windows10で桐10sを使用しています。
    >>桐10sで環境依存文字を含むデータ行をみつける良い方法はないでしょうか?
    >>後の作業で文字化けが起こったりするため防ぐ方法があればアドバイスいただけますか?
    >
    > ひょっとして、次の過去ログが参考になるかもしれませんが・・・???
    >
    > こちら
    >  ↓
    > 過去ログ90
    > ■13397 / inTopicNo.1)  unicode が含まれるデータの抽出について
    > http://tayu.o0o0.jp/bbs/kiri/cbbs.cgi?mode=al2&namber=13397&no=0&KLOG=90
    >
    >>■13397 / inTopicNo.1)  unicode が含まれるデータの抽出について
    >>□投稿者/ きりこ -(2022/07/27(Wed) 12:10:56)
    >>絞り込みの事でお伺い出来たらと思います。
    >>
    >>エクセルやUTF-8のCSVを桐に読込後、項目内のunicodeの含まれるデータを
    >>絞り込みしたい場合、どのような関数を使用すればよいのでしょうか。
    >>
    >>例えば記号を含むデータを絞り込む場合は
    >>
    >>#is記号([],0)>0
    >>
    >>等で対応できましたが、そのような関数を探してみましたがありませんでした。
    >>S-JISのCSVにして「?」をサーチするのも大変なのでお分かりになる方が
    >>いらっしゃればご教授願いたいと思います。
    >
    > p.s.
    >
    > ご案内した過去ログは長いので非常に分かりにくいですが、
    >
    > 結論を申し上げると、「シフトJISとして扱えない文字を調べる」という内容ですよ。
    >           ・・・・・・・・・・・・・・・・・・・・・
    >
    > 「シフトJISとして扱えない文字」イコール「環境依存文字」という図式ですね。(^^ゞ
    >
    >
    >>■13411 / inTopicNo.13)  Re[7]: unicode が含まれるデータの抽出について
    >>□投稿者/ ONnoji -(2022/07/28(Thu) 13:32:03)
    > >> 桐10では「𠮷」(吉の上が土)や「𦚰」(脇の力が刀)等の
    > >> 環境依存文字と言われているデータをまとめて抽出する事が出来なくて
    > >> 頭を悩ましております。
    >>
    >>なるほど!、環境依存文字なんね。早く言ってよぉ〜(@_@)
    >>
    >>最初から入力しないのが一番なんですけれど、こればっかりはどうにもなりそうにないですね。
    >>
    >>確かめたところ、やはりシフトJISで扱うと豆腐( "□" )ですね。
    >>
    >>手間でしょうけれども、簡単な手続きを作って実行すれば、検出可能ですね。
    >>
    >>先頭から終端まで順番に移動するループ内で、文字列の項目の先頭文字から順番に1文字ずつ調べるだけです。
    >>
    >>文字数やレコード数が多いと時間がかかるでしょうけれど・・・
    >
    >
    ONnojiさん」ありがとうございます。
    仰る通り、シフトJISとして扱えない文字を検出したいのです。
    結構、データ量が多いので何か関数の組み合わせのようなものはないかと思案しております。
    現状は過去ログの投稿者さんと同様にシフトJISに書き出し再度読み込みを行なうことによって?を見つける方法を行っています。

    一度、一文字ずつ調べる方法も検討してみます。
    ただ、その一文字が環境依存文字であるかどうか手続きで判断する方法が思いつきません。

    色々試してみます。
[メール受信/OFF] 削除キー/

返信無し
 
前の記事(元になった記事) 次の記事(この記事の返信)
上記関連ツリー

Nomal 環境依存文字 / とし (24/02/20(Tue) 13:47) #14169
Nomal Re[1]: 環境依存文字 / ONnoji (24/02/20(Tue) 14:17) #14170
│└Nomal 環境依存文字 / とし (24/02/20(Tue) 15:47) #14171 ←Now
Nomal Re[1]: 環境依存文字 / ONnoji (24/02/20(Tue) 16:24) #14173
  └Nomal Re[2]: 環境依存文字 / とし (24/02/21(Wed) 09:50) #14174 解決済み!
    └Nomal Re[3]: 環境依存文字 / ONnoji (24/02/21(Wed) 11:09) #14176

All 上記ツリーを一括表示 / 上記ツリーをトピック表示
 
上記の記事へ返信

Mode/  Pass/

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 ファイル一覧 検索 過去ログ

- Child Tree -
- Antispam Version -