(現在 過去ログ74 を表示中)

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

[ 最新記事及び返信フォームをトピックトップへ ]

■11218 / inTopicNo.1)  @(まるいち)、A(まるに)等を使わせない
  
□投稿者/ 悲しげ -(2018/06/23(Sat) 15:20:54)
    これをどうやって実現するか?
    ちょっと詰まっています。

    @A等の類の文字はどうやら「機種依存文字」らしいです。
    http://www.shurey.com/js/labo/character2.html
    禁止区域名     JISコード   シフトJISコード  内容
    半角カナ文字エリア 00A0〜00FF   00A0〜00FF    使用厳禁、ASCII コードと重複するエリア
    特殊文字エリア   2921〜2F7E   8540〜889E    機種依存文字の主なエリア
    縦文字エリア    7521〜7E7E   EB40〜EFFC    第2水準漢字の後部(Windows では特殊な外字)
    外字エリア     7F21〜F040〜  JIS外字エリア

    桐の関数では#JISも#シフトJISもあるので
    &JISc=#HEX32(#JIS([某])) とか &JISc=#HEX32(#SJIS([某]))
    で、上記「特殊文字エリア」の範囲にかかるかどうか・・・・
    をどうやって判断するのか・・・・、ここで詰まりました。

    ご助言をお願い致したく<(_ _)>

引用返信 [メール受信/OFF] 削除キー/
■11219 / inTopicNo.2)  Re[1]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ ONnoji -(2018/06/23(Sat) 15:47:47)
    2018/06/25(Mon) 18:14:56 編集(投稿者)
    2018/06/24(Sun) 19:59:26 編集(投稿者)
    2018/06/24(Sun) 19:48:37 編集(投稿者)
    2018/06/23(Sat) 15:58:25 編集(投稿者)
    2018/06/23(Sat) 15:53:39 編集(投稿者)

    > @A等の類の文字はどうやら「機種依存文字」らしいです。
    > http://www.shurey.com/js/labo/character2.html
    > 禁止区域名     JISコード   シフトJISコード  内容
    > 半角カナ文字エリア 00A0〜00FF   00A0〜00FF    使用厳禁、ASCII コードと重複するエリア
    > 特殊文字エリア   2921〜2F7E   8540〜889E    機種依存文字の主なエリア
    > 縦文字エリア    7521〜7E7E   EB40〜EFFC    第2水準漢字の後部(Windows では特殊な外字)
    > 外字エリア     7F21〜F040〜  JIS外字エリア
    >
    > で、上記「特殊文字エリア」の範囲にかかるかどうか・・・・
    > をどうやって判断するのか・・・・、ここで詰まりました。

    拙作で長年使っているプロシージャ:手続きは次のものです。

    ご参考になれば。

    <実行例>

    &string = "ほげほげ"
    手続き実行 prcJisコード検査( &string, &errorString )




引用返信 [メール受信/OFF] 削除キー/
■11224 / inTopicNo.3)  Re[2]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ ONnoji -(2018/06/24(Sun) 14:38:49)
    >>@A等の類の文字はどうやら「機種依存文字」らしいです。
    >>http://www.shurey.com/js/labo/character2.html
    >>禁止区域名     JISコード   シフトJISコード  内容
    >>半角カナ文字エリア 00A0〜00FF   00A0〜00FF    使用厳禁、ASCII コードと重複するエリア
    >>特殊文字エリア   2921〜2F7E   8540〜889E    機種依存文字の主なエリア
    >>縦文字エリア    7521〜7E7E   EB40〜EFFC    第2水準漢字の後部(Windows では特殊な外字)
    >>外字エリア     7F21〜F040〜  JIS外字エリア
    >>
    >>で、上記「特殊文字エリア」の範囲にかかるかどうか・・・・
    >>をどうやって判断するのか・・・・、ここで詰まりました。

    もしも、テキスト( XML等 )にJIS以外の文字を入れないように要求されていた場合ですが、

    「機種依存文字コード表」
    http://www.shurey.com/js/labo/character2.html

    このwebページは、Windows と Macintosh 間での文字の違いがテーマなので適当ではありませんよ。

    NEC特殊文字
    NEC選定IBM拡張文字
    IBM拡張文字

    ↑これらのキーワードを解説するwebページを参照されることをお勧めいたしますよ。


引用返信 [メール受信/OFF] 削除キー/
■11225 / inTopicNo.4)  Re[1]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/24(Sun) 17:20:11)
    No11218に返信(悲しげさんの記事)
    > これをどうやって実現するか?
    > ちょっと詰まっています。
    >
    > @A等の類の文字はどうやら「機種依存文字」らしいです。

    桐9 環境だけでしたっけ!?
    それとも桐10 ?

    桐10 だと unicode なので ○21 &#12881; とか、○一 &#12928; とかも
    あるし、IME の変換で出てくる場合もあるので、さらに
    難しくなりますね。
引用返信 [メール受信/OFF] 削除キー/
■11231 / inTopicNo.5)  Re[3]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ 悲しげ -(2018/06/24(Sun) 21:44:43)
    2018/06/24(Sun) 21:56:25 編集(投稿者)

    No11224に返信(ONnojiさんの記事)
    >>もしも、テキスト( XML等 )にJIS以外の文字を入れないように要求されていた場合ですが、
    >
    >「機種依存文字コード表」
    >http://www.shurey.com/js/labo/character2.html
    >↑
    >このwebページは、Windows と Macintosh 間での文字の違いがテーマなので適当ではありませんよ。

    >
    >NEC特殊文字
    >NEC選定IBM拡張文字
    >IBM拡張文字
    >
    >↑これらのキーワードを解説するwebページを参照されることをお勧めいたしますよ。

    その後、上の例だけでは足りないことに気がつきまして、最終的には
    添付のような画像を用意して注意喚起しようと考えるに至りました。

    PDCとは platform dependent characters の略とか(^^;)

    *

    で、マトレスとなって申し訳ないが

    No11225に返信(hidetakeさんの記事)
    > 桐9 環境だけでしたっけ!?
    > それとも桐10 ?
    > 桐10 だと unicode なので ○21 &#12881; とか、○一 &#12928; とかも
    > あるし、IME の変換で出てくる場合もあるので、さらに
    > 難しくなりますね。

    多店舗展開なのですが、今年1月にすべて桐10に統一しました。
    OSは全てMS-Windowsで7か10です。

    オカミにXMLとして報告するのですが、受ける側としてはWinとMacのどちら
    からも上がってくる訳で、双方の機種依存文字があると困るということだと
    勝手に想定しています。

    で、当方としてはWindows入力の側から、対Macへの注意だけ考えればよいの
    ではないかと。

    かつ当該XMLは「シフトJIS」と指定されています。
    よって桐の「印字」コマンドの記述としては

     印字開始 &XMLファイル名, SJIS出力=する, 制御文字展開=する, 終了状態=&実行リターン
     印字 "<?xml version=""1.0"" encoding=""SHIFT_JIS""?>"
     印字 "<PHARMACY_REPORT>"
     ・・・以下略

    そしてテキスト叙述部が3箇所ほどあって、その中で「半角カナ」や「まるいち」
    等の対策が必要と言う訳です。
    内「半角カナ」問題は別ツリー&後述
    機種依存文字ついては、前述再掲となりますが、添付のような画像(PDCsample.JPG)
    をドーンと画面表示させることで注意喚起するにとどめようという方向に傾いています。

    これ以外の文字もあるかもしれないが(且つMac以外で、webで直接報告したりXML報告
    を挙げたりする輩がいるのか否かも判りかねるが)、それらはweb入力時に出るエラー
    によって入力者自身が対応するに任せる、私悲しげはこれ以上関知せざるものなり、
    としてホッカムリいたしたく候。(^^;)

    *

    余談ながら(No11217のツリー再掲)、テキスト叙述部の半角カナ関連では

     手続き定義開始 t改善策::入力後(参照 文字列 &編集文字列,長整数 &モード,参照 長整数 &入力継続)
      if(#IS半角(&編集文字列,0)>0)
       &編集文字列=#全角(&編集文字列)
       &入力継続=0
      end
     手続き定義終了

    のように逃げることにしました。

608×715 => 213×250

PDCsamples.jpg
/88KB
引用返信 [メール受信/OFF] 削除キー/
■11232 / inTopicNo.6)  Re[4]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/24(Sun) 21:56:50)
    2018/06/24(Sun) 22:05:25 編集(投稿者)

    >>桐9 環境だけでしたっけ!?
    >>それとも桐10 ?
    >>桐10 だと unicode なので ○21 &#12881; とか、○一 &#12928; とかも
    >>あるし、IME の変換で出てくる場合もあるので、さらに
    >>難しくなりますね。
    >
    > 多店舗展開なのですが、今年1月にすべて桐10に統一しました。
    > OSは全てMS-Windowsで7か10です。

    桐もデータベースで使う文字コードを選択できればよいのですが
    桐10 は unicode で、それが基本でそれ以外を選べないし、
    文字コードによる入力制限もできないので、もし、unicode
    オンリーな(JISでも表現できるけどSJISでは不可能な文字)文字が
    含まれていた場合、それを SJIS で出力すると「□」x81a0 な
    文字として出力されるのかな。


    unicode な文字入力を禁止する場合、#SJ([])=33184 (x81a0) な
    文字を全て入力禁止にする必要が出てきますかね。
引用返信 [メール受信/OFF] 削除キー/
■11233 / inTopicNo.7)  Re[4]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ ONnoji -(2018/06/24(Sun) 22:05:16)
    2018/06/24(Sun) 22:05:42 編集(投稿者)

    > オカミにXMLとして報告するのですが、受ける側としてはWinとMacのどちら
    > からも上がってくる訳で、双方の機種依存文字があると困るということだと
    > 勝手に想定しています。
    >
    > で、当方としてはWindows入力の側から、対Macへの注意だけ考えればよいの
    > ではないかと。

    すでに解決したようですが、老婆心ながら…

    ご参考までに。

    相手先が Windows以外のOSでデータを処理する場合、受け取ったテキスト(シフトJIS)を別の文字コードに変換するのですよ。

    例えば、EUC-JP のように DOS / Windows では使わない文字コードに変換します。

    この時に、機種依存文字は変換できないのです。

    変換できなかった文字はゲタ(〓)になることが多いですね。

    ゲタ(〓)は、時々ネットで見かけるでしょう。

    【引用】EUC-JP 出典: フリー百科事典『ウィキペディア(Wikipedia)』
    EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつである。UNIX以外のOS上で使われることもある。


引用返信 [メール受信/OFF] 削除キー/
■11234 / inTopicNo.8)  Re[5]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ 悲しげ -(2018/06/24(Sun) 22:14:23)
    No11232に返信(hidetakeさんの記事)
    > unicode な文字入力を禁止する場合、#SJ([])=33184 (x81a0) な
    > 文字を全て入力禁止にする必要が出てきますかね。

    ま、そこまで対処する気は無い(と言うかできない)けど、もし
    やるとしたら、入力後イベントで&編集文字列の中に当該文字列
    が含まれるかどうかで判断するってことになるんでしょうか?

引用返信 [メール受信/OFF] 削除キー/
■11235 / inTopicNo.9)  Re[5]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ 悲しげ -(2018/06/24(Sun) 22:23:34)
    No11233に返信(ONnojiさんの記事)
    > 相手先が Windows以外のOSでデータを処理する場合、受け取ったテキスト(シフトJIS)
    >を別の文字コードに変換するのですよ。
    > 例えば、EUC-JP のように DOS / Windows では使わない文字コードに変換します。
    > この時に、機種依存文字は変換できないのです。
    > 変換できなかった文字はゲタ(〓)になることが多いですね。
    > ゲタ(〓)は、時々ネットで見かけるでしょう。

    あ、そうなんですか。
    ちなみにマルイチとかは、ゲタではなく「?」と表示され、かつ当該項目の全テキストが赤字になりました。

引用返信 [メール受信/OFF] 削除キー/
■11236 / inTopicNo.10)  Re[6]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ ONnoji -(2018/06/24(Sun) 22:31:17)
    2018/06/24(Sun) 22:35:00 編集(投稿者)
    2018/06/24(Sun) 22:33:27 編集(投稿者)

    >>相手先が Windows以外のOSでデータを処理する場合、受け取ったテキスト(シフトJIS)
    > >を別の文字コードに変換するのですよ。
    >>例えば、EUC-JP のように DOS / Windows では使わない文字コードに変換します。
    >>この時に、機種依存文字は変換できないのです。
    >>変換できなかった文字はゲタ(〓)になることが多いですね。
    >>ゲタ(〓)は、時々ネットで見かけるでしょう。
    >
    > あ、そうなんですか。
    > ちなみにマルイチとかは、ゲタではなく「?」と表示され、かつ当該項目の全テキストが赤字になりました。

    ゲタ(〓)になるか、クエスチョン(?)になるかは処理するソフトによって様々でしょうね。

    オカミがどんなOSを使っているかはワカリマセンが、

    JISに規定されている文字ならば、符号化がシフトJISでもOKということだと思いますよ。※変換処理が可能だから

    しかし、PCメーカが勝手に拡張した機種依存文字は化けちゃうのでイヤヨイヤイヤということだろうと思いますよ。



引用返信 [メール受信/OFF] 削除キー/
■11237 / inTopicNo.11)  Re[7]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/25(Mon) 08:02:37)
    > JISに規定されている文字ならば、符号化がシフトJISでもOKということだと思いますよ。※変換処理が可能だから

    どの時代のどの規格の JIS の事を言われているのかな!?
    時代により、扱える文字や字形の変更もあります。

    昔はいろいろ書いていたけど、さらに面倒になったので
    あとは、省略。
引用返信 [メール受信/OFF] 削除キー/
■11238 / inTopicNo.12)  Re[8]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ ONnoji -(2018/06/25(Mon) 08:57:35)
    >>JISに規定されている文字ならば、符号化がシフトJISでもOKということだと思いますよ。※変換処理が可能だから
    > どの時代のどの規格の JIS の事を言われているのかな!?
    > 時代により、扱える文字や字形の変更もあります。

    JIS X はいろいろ変遷していますね。

    機種依存文字だけチェックすればいいのではないかと思いますよ。


引用返信 [メール受信/OFF] 削除キー/
■11240 / inTopicNo.13)  Re[9]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/25(Mon) 09:50:04)
    > JIS X はいろいろ変遷していますね。
    > 機種依存文字だけチェックすればいいのではないかと思いますよ。

    だから大変。
    Shift_JIS の話をするならば別ですが。

引用返信 [メール受信/OFF] 削除キー/
■11241 / inTopicNo.14)  Re[10]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/25(Mon) 10:06:39)
    昔、オフコンとのデータやりとりを行う際は、桐だけで
    処理するのは面倒なので、次のようなスクリプトを sed
    で処理させていました。古い時代のこと。

    --------------------------------------------------------------
    # JIS規格以外の文字を「〓」に変換
    # -----------------------------------------------------------------------------
    # 222F - 232F (81AD - 824E) ※〓の後〜数字の前の空き間(新JIS記号も)
    # 233A - 2340 (8259 - 825F) ※全角数字の後〜英大文字の前の空き間
    # 235B - 2360 (827A - 8280) ※全角英大文字の後〜英小文字の前の空き間
    # 237B - 237E (829B - 829E) ※全角英小文字の後〜ひらがなの前の空き間
    # 2474 - 247E (82F2 - 833F) ※ひらがなの後〜全角カタカナの前の空き間
    # 2577 - 257E (8397 - 839E) ※全角カタカナの後〜ギリシア文字の前の空き間
    # 2639 - 2640 (83B7 - 83BE) ※ギリシア大文字の後〜小文字の前の空き間
    # 2659 - 267E (83D7 - 843F) ※ギリシア文字の後〜ロシア文字の前の空き間
    # 2742 - 2750 (8461 - 846F) ※ロシア大文字の後〜小文字の前の空き間
    # 2772 - 2F7E (8492 - 889E) ※漢字第1水準の前の空き間(新JIS罫線も)
    # 4F54 - 4F7E (9873 - 989E) ※第1水準と第2水準の間の空き間
    # 7421 - 7424 (EA9F - EAA2) ※新JISで字形変更された尭槙遥瑶の旧字体
    # 7425 - 7E7E (EAA3 - EFFC) ※第2水準の後の空き間
    # 7F21 - FCFC (7F21 - FCFC) ※第2水準の後の空き間
    # -----------------------------------------------------------------------------
    /[ -・]/{
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[・-・]/〓/g
    s/[堯-・]/〓/g
    }
    --------------------------------------------------------------

    桐も正規表現が使えるようになれば良いのに。
    なんて何十年も言い続けている。 orz



CHECK.TXT
/1KB
引用返信 [メール受信/OFF] 削除キー/
■11243 / inTopicNo.15)  Re[11]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ ONnoji -(2018/06/25(Mon) 10:14:33)
    > 昔、オフコンとのデータやりとりを行う際は、桐だけで
    > 処理するのは面倒なので、次のようなスクリプトを sed
    > で処理させていました。古い時代のこと。
    > 桐も正規表現が使えるようになれば良いのに。
    > なんて何十年も言い続けている。 orz

    情報ありがとうございます。

    この件はキリがなさそうなので、これくらいで打ち切りにしましょうよ。

    別件ですが、こんなの見つかりました。

    当方は、Windows10環境が無いので試していませんが…(^^ゞ
     ↓
    121ware.com サービス&サポート Q&amp;A Q&A番号 017777
    Windows 10のMicrosoft IMEで変換候補に環境依存文字を表示させないようにする方法
    https://121ware.com/qasearch/1007/app/servlet/relatedqa?QID=017777


引用返信 [メール受信/OFF] 削除キー/
■11249 / inTopicNo.16)  Re[2]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/25(Mon) 22:55:53)
    桐の内部の文字はどうであれ、

    外部に受け渡す XML ファイルの機種依存文字?を理解できる
    文字に置き換えればよいのであれば、XML ファイルをそのような
    ファイルに変換する方法もあります。

    半角カナや@などを変換するには

    xfer.sed (ここに添付する際は xfer.txt で添付します)
    ------------------------------------------------------------------
    # 半角文字を全角文字に

    /[!-゚]/{

    # 先行する文字がが半角片仮名であれば "ー"(音引き)を”ー”に
    s/\([ヲ-゚]\)ー/\1ー/g

    # そうでない "ー"(音引き)は ”−”に
    s/ー/−/g

    # 半角カナを全角カナへ

    y/ァアィイゥウェエォオカキクケコサシスセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン゙゚/ァアィイゥウェエォオカキクケコサシスセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン゛゜/

    s/カ゛/ガ/g
    s/キ゛/ギ/g
    s/ク゛/グ/g
    s/ケ゛/ゲ/g
    s/コ゛/ゴ/g
    s/サ゛/ザ/g
    s/シ゛/ジ/g
    s/ス゛/ズ/g
    s/セ゛/ゼ/g
    s/ソ゛/ゾ/g
    s/タ゛/ダ/g
    s/チ゛/ヂ/g
    s/ツ゛/ヅ/g
    s/テ゛/デ/g
    s/ト゛/ド/g
    s/ハ゛/バ/g
    s/ヒ゛/ビ/g
    s/フ゛/ブ/g
    s/ヘ゛/ベ/g
    s/ホ゛/ボ/g
    s/ハ゜/パ/g
    s/ヒ゜/ピ/g
    s/フ゜/プ/g
    s/ヘ゜/ペ/g
    s/ホ゜/ポ/g
    s/ウ゛/ヴ/g

    # 句読点と括弧

    y/。、「」ー/。、「」ー/
    }

    # NEC純正(?)半角2バイト文字を「普通」の半角文字へ

    /[・-・]/{
    s/\([・・・・・・・・・・・・・・・・・・・・・]\)/\1゙/g
    s/\([・・・・・]\)/\1゚/g
    y@・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・@!"#$%&'()*+,-./0123456789:;<=>?@
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/`abcdefghijklmnopqrstuvwxyz{|}~/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタチツテト/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/ナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゙゚イエワカケ/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・/ウカキクケコサシスセソタチツテトハハヒヒフフヘヘホホ/
    }
    # 便利な記号だが、JIS規格に無い文字なので・・・・・
    /[@-∪]/{
    s/@/(1)/g
    s/A/(2)/g
    s/B/(3)/g
    s/C/(4)/g
    s/D/(5)/g
    s/E/(6)/g
    s/F/(7)/g
    s/G/(8)/g
    s/H/(9)/g
    s/I/(10)/g
    s/J/(11)/g
    s/K/(12)/g
    s/L/(13)/g
    s/M/(14)/g
    s/N/(15)/g
    s/O/(16)/g
    s/P/(17)/g
    s/Q/(18)/g
    s/R/(19)/g
    s/S/(20)/g
    s/T/\[1\]/g
    s/U/\[2\]/g
    s/V/\[3\]/g
    s/W/\[4\]/g
    s/X/\[5\]/g
    s/Y/\[6\]/g
    s/Z/\[7\]/g
    s/[/\[8\]/g
    s/\/\[9\]/g
    s/]/\[10\]/g
    s/@/\[1\]/g
    s/A/\[2\]/g
    s/B/\[3\]/g
    s/C/\[4\]/g
    s/D/\[5\]/g
    s/E/\[6\]/g
    s/F/\[7\]/g
    s/G/\[8\]/g
    s/H/\[9\]/g
    s/I/\[10\]/g
    s/_/ミリ/g
    s/`/キロ/g
    s/a/センチ/g
    s/b/メートル/g
    s/c/グラム/g
    s/d/トン/g
    s/e/アール/g
    s/f/ヘクタール/g
    s/g/リットル/g
    s/h/ワット/g
    s/i/カロリー/g
    s/j/ドル/g
    s/k/セント/g
    s/l/パーセント/g
    s/m/ミリバール/g
    s/n/ページ/g
    s/o/mm/g
    s/p/cm/g
    s/q/km/g
    s/r/mg/g
    s/s/kg/g
    s/t/cc/g
    s/u/平方メートル/g
    s//"/g
    s//"/g
    s//No./g
    s//K.K/g
    s//TEL/g
    s//(上)/g
    s//(中)/g
    s//(下)/g
    s//(左)/g
    s//(右)/g
    s//(株)/g
    s//(有)/g
    s//(代)/g
    s//明治/g
    s//大正/g
    s//昭和/g
    s/~/平成/g
    }
    ------------------------------------------------------------------

    コマンドラインで
    sed -f xfer.sed input.txt > output.txt
    とすれば、一発変換可能です。

    sed は sed.exe で exe で提供されているので 64bit 環境でも
    動作します。





xfer.txt
/2KB
引用返信 [メール受信/OFF] 削除キー/
■11250 / inTopicNo.17)  Re[3]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/25(Mon) 23:00:37)
    > コマンドラインで
    > sed -f xfer.sed input.txt > output.txt
    > とすれば、一発変換可能です。

    xfer.sed を xfer.sed で置換した結果は下記のようになります。

    さすがに
    ---------------------------------------
    # NEC純正(?)半角2バイト文字を「普通」の半角文字へ

    /[・-・]/{
    s/\([・・・・・・・・・・・・・・・・・・・・・]\)/\1゙/g
    s/\([・・・・・]\)/\1゚/g
    y@・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・@!"#$%&'()*+,-./0123456789:;<=>?@
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/`abcdefghijklmnopqrstuvwxyz{|}~/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタチツテト/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・/ナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゙゚イエワカケ/
    y/・・・・・・・・・・・・・・・・・・・・・・・・・・/ウカキクケコサシスセソタチツテトハハヒヒフフヘヘホホ/
    }
    ---------------------------------------
    この部分は削除して良いかな!!


    結果は
    ---------------------------------------
    # 半角文字を全角文字に

    /[!-゜]/{

    # 先行する文字がが半角片仮名であれば "−"(音引き)を”ー”に
    s/\([ヲ-゜]\)−/\1ー/g

    # そうでない "−"(音引き)は ”−”に
    s/−/−/g

    # 半角カナを全角カナへ

    y/ァアィイゥウェエォオカキクケコサシスセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン゛゜/ァアィイゥウェエォオカキクケコサシスセソタチッツテトナニヌネノハヒフヘホマミムメモャヤュユョヨラリルレロワヲン゛゜/

    s/ガ/ガ/g
    s/ギ/ギ/g
    s/グ/グ/g
    s/ゲ/ゲ/g
    s/ゴ/ゴ/g
    s/ザ/ザ/g
    s/ジ/ジ/g
    s/ズ/ズ/g
    s/ゼ/ゼ/g
    s/ゾ/ゾ/g
    s/ダ/ダ/g
    s/ヂ/ヂ/g
    s/ヅ/ヅ/g
    s/デ/デ/g
    s/ド/ド/g
    s/バ/バ/g
    s/ビ/ビ/g
    s/ブ/ブ/g
    s/ベ/ベ/g
    s/ボ/ボ/g
    s/パ/パ/g
    s/ピ/ピ/g
    s/プ/プ/g
    s/ペ/ペ/g
    s/ポ/ポ/g
    s/ヴ/ヴ/g

    # 句読点と括弧

    y/。、「」−/。、「」ー/
    }

    # NEC純正(?)半角2バイト文字を「普通」の半角文字へ

    /[?゚゙-?゚゙]/{
    s/\([?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙]\)/\1゛/g
    s/\([?゚゙?゚゙?゚゙?゚゙?゚゙]\)/\1゜/g
    y@?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙@!"#$%&'()*+,-./0123456789:;<=>?@
    y/?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙/@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_/
    y/?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙/`abcdefghijklmnopqrstuvwxyz{|}~/
    y/?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙/・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタチツテト/
    y/?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙/ナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゛゜イエワカケ/
    y/?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙?゚゙/ウカキクケコサシスセソタチツテトハハヒヒフフヘヘホホ/
    }
    # 便利な記号だが、JIS規格に無い文字なので・・・・・
    /[(1)-∪]/{
    s/(1)/(1)/g
    s/(2)/(2)/g
    s/(3)/(3)/g
    s/(4)/(4)/g
    s/(5)/(5)/g
    s/(6)/(6)/g
    s/(7)/(7)/g
    s/(8)/(8)/g
    s/(9)/(9)/g
    s/(10)/(10)/g
    s/(11)/(11)/g
    s/(12)/(12)/g
    s/(13)/(13)/g
    s/(14)/(14)/g
    s/(15)/(15)/g
    s/(16)/(16)/g
    s/(17)/(17)/g
    s/(18)/(18)/g
    s/(19)/(19)/g
    s/(20)/(20)/g
    s/[1]/\[1\]/g
    s/[2]/\[2\]/g
    s/[3]/\[3\]/g
    s/[4]/\[4\]/g
    s/[5]/\[5\]/g
    s/[6]/\[6\]/g
    s/[7]/\[7\]/g
    s/[8]/\[8\]/g
    s/[9]/\[9\]/g
    s/[10]/\[10\]/g
    s/[1]/\[1\]/g
    s/[2]/\[2\]/g
    s/[3]/\[3\]/g
    s/[4]/\[4\]/g
    s/[5]/\[5\]/g
    s/[6]/\[6\]/g
    s/[7]/\[7\]/g
    s/[8]/\[8\]/g
    s/[9]/\[9\]/g
    s/[10]/\[10\]/g
    s/ミリ/ミリ/g
    s/キロ/キロ/g
    s/センチ/センチ/g
    s/メートル/メートル/g
    s/グラム/グラム/g
    s/トン/トン/g
    s/アール/アール/g
    s/ヘクタール/ヘクタール/g
    s/リットル/リットル/g
    s/ワット/ワット/g
    s/カロリー/カロリー/g
    s/ドル/ドル/g
    s/セント/セント/g
    s/パーセント/パーセント/g
    s/ミリバール/ミリバール/g
    s/ページ/ページ/g
    s/mm/mm/g
    s/cm/cm/g
    s/km/km/g
    s/mg/mg/g
    s/kg/kg/g
    s/cc/cc/g
    s/平方メートル/平方メートル/g
    s/"/"/g
    s/"/"/g
    s/No./No./g
    s/K.K/K.K/g
    s/TEL/TEL/g
    s/(上)/(上)/g
    s/(中)/(中)/g
    s/(下)/(下)/g
    s/(左)/(左)/g
    s/(右)/(右)/g
    s/(株)/(株)/g
    s/(有)/(有)/g
    s/(代)/(代)/g
    s/明治/明治/g
    s/大正/大正/g
    s/昭和/昭和/g
    s/平成/平成/g
    }
    ---------------------------------------


output.txt
/3KB
引用返信 [メール受信/OFF] 削除キー/
■11251 / inTopicNo.18)  Re[4]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/25(Mon) 23:04:14)
    xfer.sed の次の部分は
    -----------------
    s/_/ミリ/g
    s/`/キロ/g
    s/a/センチ/g
    s/b/メートル/g
    s/c/グラム/g
    s/d/トン/g
    s/e/アール/g
    s/f/ヘクタール/g
    s/g/リットル/g
    s/h/ワット/g
    s/i/カロリー/g
    s/j/ドル/g
    s/k/セント/g
    s/l/パーセント/g
    s/m/ミリバール/g
    s/n/ページ/g
    s/u/平方メートル/g
    -----------------

    最初から全角カナに変換するか

    xfer.sed の変換の順序を変えて、最後に半角カナの
    全角化を行うようにした方が良いでしょう。

引用返信 [メール受信/OFF] 削除キー/
■11252 / inTopicNo.19)  Re[5]: @(まるいち)、A(まるに)等を使わせない
□投稿者/ hidetake -(2018/06/26(Tue) 12:09:58)
    sed.exe

    自分が使用しているのは


    [Free][PICKUP]sed win32 1.18+mb1.03 GNU sed / Win32 Version ストリームエディタ (157K)
    ---sed118.zip Version 1.18+mb1.03 157 K1995.1.29

    パッケージされたものは消失してしまった。

    Vector には自分が使っているものと同じ EXE版は
    すでに無くなっているようだ。

    DLL 版だと
    https://www.vector.co.jp/soft/win95/util/se028215.html
    にあり、そのまま動くようだ。

    新しいもの(SED.EXE)だと通らないもものがある。


引用返信 [メール受信/OFF] 削除キー/
■11264 / inTopicNo.20)  Re[1]: 文字制限
□投稿者/ 尾形 -(2018/06/28(Thu) 17:03:57)
引用返信 [メール受信/OFF] 削除キー/

次の20件>

トピック内ページ移動 / << 0 | 1 >>

[このトピックに返信]
Mode/  Pass/

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

- Child Tree -
- Antispam Version -