(現在 過去ログ64 を表示中)

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

[ 最新記事及び返信フォームをトピックトップへ ]

■9862 / inTopicNo.1)  環境依存文字の保存と出力
  
□投稿者/ モモンガ -(2016/05/30(Mon) 15:52:58)
    Unicodeでデータを管理する事となり桐10の購入を検討しています。

    質問したい内容としては
    1.桐10に切り替えることで、テーブル内のデータは強制的にUnicodeで
      保存されるという認識でよいでしょうか?(環境設定などで変更可能?)

    2.桐9からのデータ移行で何か注意しなければならない事は
      ないでしょうか?
     (桐の問題ではないとは思いますが、S-JISの外字登録されている
      文字なども心配です。)

    3.UTF-8でCSVファイルを作成する必要があるのですが、
      桐10は対応しているでしょうか?
     (読み込みは自動認識するとの記載は見つけました。)

    どなたかご教授願います。
引用返信 [メール受信/OFF] 削除キー/
■9863 / inTopicNo.2)  Re[1]: 環境依存文字の保存と出力
□投稿者/ ONnoji -(2016/05/30(Mon) 16:17:30)
    > 3.UTF-8でCSVファイルを作成する必要があるのですが、
    >   桐10は対応しているでしょうか?
    >  (読み込みは自動認識するとの記載は見つけました。)

    回答ではありません。逆質問です。m(__)m

    ・UTF-8でCSVファイルを云々という情報は、どこで見つけましたか?

    ・UTF-8でCSVファイルを読み込むのは桐ですか?それとも??

    以上2点を教えていただけると嬉しいです。

    よろしくお願いいたします。


引用返信 [メール受信/OFF] 削除キー/
■9864 / inTopicNo.3)  Re[2]: 環境依存文字の保存と出力
□投稿者/ モモンガ -(2016/05/30(Mon) 16:30:10)
    ONnojiさん

    早速のレスありがとうございます。

    > 回答ではありません。逆質問です。m(__)m
    > ・UTF-8でCSVファイルを云々という情報は、どこで見つけましたか?

    私の解釈が違っているのかもしれないのですが、
    以下のサイトの「その他新機能」で見つけました。
    https://www.kthree.co.jp/kiri/ct_product/kiri10/new_features.html

    > ・UTF-8でCSVファイルを読み込むのは桐ですか?それとも??

    今回やりたいのは桐のシステムからCSVファイルをUTF-8で作成したいです。
    UTF-8のCSVファイルは、桐ではない別のシステムが取り込みます。

    宜しくお願いします。
引用返信 [メール受信/OFF] 削除キー/
■9865 / inTopicNo.4)  Re[3]: 環境依存文字の保存と出力
□投稿者/ ONnoji -(2016/05/30(Mon) 17:02:45)
    この掲示板に内容が関連するツリーがあるのでお知らせします。

    問題が解決するか否かというよりも、より多くの情報を知るという意味でお知らせします。

    こちら
     ↓
    http://tayu.o0o0.jp/bbs/kiri/cbbs.cgi?mode=all&namber=9621&type=0&space=0&no=0
    ■9621 / 親階層)  CSVファイル(unicode形式)をExcelで開きたい。

    取り急ぎお知らせまで。


    追伸

    逆質問に回答していただきありがとうございます。

    私からのご返事は後ほどさせていただきます。


引用返信 [メール受信/OFF] 削除キー/
■9866 / inTopicNo.5)  Re[3]: 環境依存文字の保存と出力
□投稿者/ たゆー -(2016/05/30(Mon) 17:28:35)
    > 今回やりたいのは桐のシステムからCSVファイルをUTF-8で作成したいです。
    桐から直接CSVで作成すると「書き出し CSV」を見ると「シフトJIS」と記載してあります

    > 詳しくはしくは「桐10移行ガイド(桐9からの移行に関して)」をご覧ください。
    https://www.kthree.co.jp/kiri/ct_product/kiri10/migration.html
    ・特に桐10で追加された「Unicode」は、別として、一端テキストで
    「シフトJIS、UTF-16」で、書き出しを行い、例えばフリーソフト等で
     漢字コード変換されてはいかがでしょうか。

    ○同ページに「外字について」の説明も記載されてます


引用返信 [メール受信/OFF] 削除キー/
■9867 / inTopicNo.6)  Re[4]: 環境依存文字の保存と出力
□投稿者/ ONnoji -(2016/05/30(Mon) 18:05:19)
    2016/05/31(Tue) 13:12:26 編集(投稿者)
    2016/05/30(Mon) 18:08:19 編集(投稿者)

    > 私の解釈が違っているのかもしれないのですが、
    > 以下のサイトの「その他新機能」で見つけました。
    > https://www.kthree.co.jp/kiri/ct_product/kiri10/new_features.html

    これですね。
     ↓
    >テキスト、CSVなど外部から入力するファイルの文字コードを自動判定
    >Unicodeへの対応に合わせて、外部から読み込むファイルの文字コード自動判定機能を追加しました。
    >Shift_JIS、UTF-16LE、UTF-8など通常使われる文字コードであれば、
    >桐が自動的に識別し、読み込み時に必要な変換を行います。
    >文字コードを意識せずにお使いいただけます。

    UTF-8 の CSV をインポート出来ると書いてあるので、へー!?と思って、たった今試してみました。

    桐10で[書き出し:CSV]で書き出したファイルの文字コードは(必ず)シフトJISになります。

    これをメモ帳で開き、[文字コード]で UTF-8 を指定して別名にて保存して、

    保存したファイルを[読み込み:CSV]で読み込んだところ、文字化けせずに読み込めました。

    [開く]で CSV から 表( .tbx )も作成できました。

    ということで、看板に偽りはないようですね。

    ただし、この説明は桐10がインポート(取り込み)する場合のことで、

    桐10で[書き出し:CSV]で書き出したファイルの文字コードは(必ず)シフトJISになります。

    従って、[シフトJIS → UTF-8]の変換ソフトを利用しないと実用的ではないのでご注意が必要です。

    >> ・UTF-8でCSVファイルを読み込むのは桐ですか?それとも??
    > 今回やりたいのは桐のシステムからCSVファイルをUTF-8で作成したいです。
    > UTF-8のCSVファイルは、桐ではない別のシステムが取り込みます。

    なお、[印字開始]コマンドでは、

    印字開始  <ファイル名>,\
     追加,\
     SJIS出力 = しない|する,\
     制御文字展開 = しない|する,\
     終了状態 = <変数名>

    デフォルトが SJIS出力 = しない ですが、文字コード は必ず UTF-16 です。

    ただし単に UTF-16 と言っていますが、厳密には[UTF-16 リトルエンディアン(Little Endian)]です。

    ということで、現状の桐10には UTF-8 の文字コードでテキストをディスクに書き出す機能は無いということです。


488×547 => 223×250

2016-05-30-02.jpg
/54KB
引用返信 [メール受信/OFF] 削除キー/
■9868 / inTopicNo.7)  Re[4]: 環境依存文字の保存と出力
□投稿者/ モモンガ -(2016/05/30(Mon) 18:29:35)
    たゆーさん、回答ありがとうございます。

    参考にしていたサイトの先にあったとは気づきませんでした^^;
    移行に関しても記載がありましたので、クローズとさせていただきます。

    ONnojさん、たゆーさん、ありがとうございました。
解決済み!
引用返信 [メール受信/OFF] 削除キー/
■9869 / inTopicNo.8)  Re[5]: 環境依存文字の保存と出力
□投稿者/ モモンガ -(2016/05/30(Mon) 18:35:43)
    ONnojiさん

    取込みの確認までしていただき
    ありがとうございました。

    ご回答いただいたように、
    エディタの保存形式を変更する方法で対応したいと思います。

    本件はクローズとさせていただきます。
解決済み!
引用返信 [メール受信/OFF] 削除キー/
■9870 / inTopicNo.9)  「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ ONnoji -(2016/05/30(Mon) 21:21:45)
    2016/05/30(Mon) 22:47:19 編集(投稿者)

    > 今回やりたいのは桐のシステムからCSVファイルをUTF-8で作成したいです。
    > UTF-8のCSVファイルは、桐ではない別のシステムが取り込みます。

    本題の前に余談ですが…

    昔々、DOSのころは、単純に値をコンマで区切ったテキストという意味で、

    CSV(コンマ・セパレーテッド・バリュー)形式と呼んでいて、特に拡張子に関しては既定値はありませんでした。

    ところが、MS帝国がエクセルでサポートするファイルの拡張子として .csv を採用してから、

    CSVファイル = エクセルで開けるファイル と認識されるようになってしまいました。

    いわば河川争奪ならぬ拡張子争奪の結果なのですが、

    CSVファイル = エクセルで開けるファイル = 拡張子 .csv という図式が出来上がってしまったようです。

    さて、本題です。

    「桐10からUTF-8のCSVファイルを出力できるか否か」という問い合わせは、今後も増えるかと思われます。

    もしも差し支えなければ、「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?

    具体名を公開できなければ、どんな種類のシステムか教えていただけると嬉しいです。

    よろしくお願いいたします。m(__)m


引用返信 [メール受信/OFF] 削除キー/
■9871 / inTopicNo.10)  Re[7]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ モモンガ -(2016/05/31(Tue) 10:00:02)
    DOSの時代・・・

    少し前に桐の初版が1986年だと知り、ドラクエ1の発売と同じ年やんと
    驚いていたところです。

    >「桐10からUTF-8のCSVファイルを出力できるか否か」という問い合わせは、今後も増えるかと思われます。
    >もしも差し支えなければ、「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?

    正直なところ連携の仕様書しか渡されておらず別業者のシステムがどのような言語で
    開発されているか分からないです^^;

    顧客を通して別業者にS-JISでは駄目か打診しているところで
    OKが出れば変換作業もなくなり運用も楽になるのではと考えています。

    (公共の住基関連と連携するシステムなのでツール等のインストールも
     融通が利かない可能性が高い状態でして・・・TT)

    桐については始めたばかりで恥ずかしいレベルの質問をしてしまうかもですが、
    今後ともよろしくお願いします。

引用返信 [メール受信/OFF] 削除キー/
■9872 / inTopicNo.11)  Re[8]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ ONnoji -(2016/05/31(Tue) 10:18:17)
    2016/05/31(Tue) 10:25:54 編集(投稿者)
    2016/05/31(Tue) 10:21:20 編集(投稿者)

    > >「桐10からUTF-8のCSVファイルを出力できるか否か」という問い合わせは、今後も増えるかと思われます。
    > >もしも差し支えなければ、「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
    >
    > 正直なところ連携の仕様書しか渡されておらず別業者のシステムがどのような言語で
    > 開発されているか分からないです^^;
    >
    > 顧客を通して別業者にS-JISでは駄目か打診しているところで
    > OKが出れば変換作業もなくなり運用も楽になるのではと考えています。
    >
    > (公共の住基関連と連携するシステムなのでツール等のインストールも
    >  融通が利かない可能性が高い状態でして・・・TT)

    情報ありがとうございます。

    住基関連となると、UTF-8 は譲れぬ一線になりそうですね。


    さて、桐10で出力できる文字コードは、UTF-16 little endian または シフトJis ですから、

    UTF-8 で出力することは最初から無理ですね。

    ところで、どうして CSV が シフトJis(= ANSI )なのか気になって調べていたのですが、

    これはエクセルの仕様のようですね。

    CSV 自体がレガシー(時代遅れのもの)システムのファイル形式という感じですね。

    ユニコード以前のシステムとデータ交換を計るためのファイル形式という扱いのような…。

    ※ちなみに、私はエクセルの使い方も知らなくて、これはすべてwebから得た情報です。

    興味深いページを見つかましたので、以下にお知らせします。
     ↓
    【引用】Excel で UTF-8 の CSV を作成したい - マイクロソフト コミュニティ
    http://answers.microsoft.com/ja-jp/office/forum/office_2010-excel/excel-%E3%81%A7-utf8-%E3%81%AE-csv/25d8bea2-f20c-4feb-9216-e06cb3bf0757?auth=1

    > はじめまして、同じ問題で検索をしていてこの投稿を見つけました。
    > (Microsoft Community)How can I save a csv with utf-8 encoding using Excel 2013?
    > http://answers.microsoft.com/en-us/office/forum/office_2013_release-excel/how-can-i-save-a-csv-with-utf-8-encoding-using/12801501-c1e4-4a64-80d9-96b680b64cfe
    > では、以下のようにまとめられていました。
    > UTF-8 is an encoding set that can contain any Unicode character.
    > Unfortunately, not all applications can encode files in UTF-8 by default,
    > and Microsoft Excel is one of them.
    > Instead of Unicode, Excel encodes CSV files using ANSI.
    > CSV形式でも文字コード選択ができるようになるとよいなと痛感します。
    > できれば、デフォルトをUTF-8 などにしていただけるとありがたいです。


    ◇ ◇ ◇ ◇ ◇ ◇

    英和辞典を引くのが面倒なので、自動翻訳してみる。

    【原文】

    UTF-8 is an encoding set that can contain any Unicode character.
    Unfortunately, not all applications can encode files in UTF-8 by default,
    and Microsoft Excel is one of them.
    Instead of Unicode, Excel encodes CSV files using ANSI.


    【翻訳】

    UTF-8は、どんなユニコード性格でも含むことができるエンコーディング・セットです。
    残念なことに、すべてのアプリケーションがデフォルトでファイルをUTF-8にコード化することができるというわけではありません、
    そして、Microsoft Excelは彼らのうちの1人です。
    ユニコードの代わりに、ExcelはANSIを用いたCSVファイルをコード化します。

    ◇ ◇ ◇ ◇ ◇ ◇

    ユニコードの代わりに、ExcelはANSIを用いたCSVファイルをコード化します。

    つまり、桐10 は エクセルの仕様に合わせているので CSV をシフトJis(= ANSI )で出力するというわけなんだろうね。


引用返信 [メール受信/OFF] 削除キー/
■9873 / inTopicNo.12)  Re[9]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ モモンガ -(2016/05/31(Tue) 10:55:03)
    ONnojiさん

    なるほど、EXCELに準拠という事ですねぇ。

    メモ帳でもUTF-8で保存できるとの記載があったので
    ツールのインストールもしなくてよさそうです。

    ありがとうございました。
引用返信 [メール受信/OFF] 削除キー/
■9874 / inTopicNo.13)  Re[10]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ ONnoji -(2016/05/31(Tue) 10:57:38)
    2016/05/31(Tue) 14:30:01 編集(投稿者)
    2016/05/31(Tue) 13:23:49 編集(投稿者)
    2016/05/31(Tue) 13:21:21 編集(投稿者)
    2016/05/31(Tue) 11:14:54 編集(投稿者)
    2016/05/31(Tue) 11:12:30 編集(投稿者)
    2016/05/31(Tue) 11:10:28 編集(投稿者)
    2016/05/31(Tue) 10:59:08 編集(投稿者)

    > なるほど、EXCELに準拠という事ですねぇ。
    >
    > メモ帳でもUTF-8で保存できるとの記載があったので
    > ツールのインストールもしなくてよさそうです。

    以下の二案を拡張子や区切り文字形式を無視して考えてください。

    (A案)桐10の表(Unicode) → シフトJisのテキスト → コンバータ → UTF-8 のテキスト

    (B案)桐10の表(Unicode) → UTF-16 little endian のテキスト → コンバータ → UTF-8 のテキスト

    A案では、桐10の表(Unicode) → シフトJisのテキスト の時点で、異体字などの付加情報が欠落するハズです。

    従って、B案が最善です。

    [書き出し:CSV]はエクセルの仕様に準拠しているので、常にシフトJis です。

    というわけで以下の方法をお勧めします



    桐には[印字開始][印字][印字終了]というコマンドがあります。

    桐10では、デフォルトの文字コードが UTF-16 little endian です。

    <手順の概要>

    まず、[印字開始]で書き出しテキストファイルをオープンします。

    次に表のトップレコードから順に[印字]コマンドで項目の値を出力します。

    項目の値以外の区切り文字(例えばコンマ)も出力できます。

    囲み文字(例えば二重引用符)も出力できます。

    CR・LFも任意に出力できます。

    そして、ボトムレコードを超えて表の終端に達したら

    [印字終了]コマンドで書き出しテキストファイルをクローズします。

    <例>

     印字開始 &mSaveFileName, 終了状態 = &status
    ┌if ( &status = 1 )

    │ ジャンプ 行番号 = 先頭
    │┌繰り返し ( .not #eof )
    ││
    ││ 印字 [項目], _13, _10,
    ││ ジャンプ 行番号 = 次行
    │└繰り返し終了

    │ 印字終了

    └end


    <蛇足>

    コンマ区切りのテキストよりも、タブ区切りのテキストの方がシンプルです。

    現行の仕様の CSVをタブ区切りテキストに変更することをお勧めします。

    今時、コンマ区切りは古い感じがしますよ。

    タブ区切りならば、桐の[書き出し:テキスト]で簡単に出力できます。

    区切り文字にはタブがデフォルトになってますから簡単ですよ。




引用返信 [メール受信/OFF] 削除キー/
■9875 / inTopicNo.14)  Re[11]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ モモンガ -(2016/06/01(Wed) 19:22:01)
    すみません。
    さらにコメントを頂いていることに気が付きませんでした。


    文字コードについてですが、桐はJIS第3・第4水準漢字を完全サポートとの記載なので
    以下のような認識でいます。

    JIS       :Unicode
    ---------------------------------
    第1、第2水準漢字 :対応
    第3水準漢字    :対応
    第3水準非漢字   :対応
    第4水準漢字    :対応
    外字        :非対応

    Unicode       :JIS
    ---------------------------------
    私用領域      :非対応

    つまりUnicodeの私用領域部分が欠落してしまう・・・ダメじゃんww

    ONnojiのおっしゃる通りですね。
    (納品・運用する前でよかったです。)


    まだ桐10を購入していないですが、購入次第試してみようと思います。

    ありがとうございました。

    P.S.
    CSVカンマ区切りは先方からの提示なので変えられないかもしれないですが、
    ダメもとで打診してみようと思います。


引用返信 [メール受信/OFF] 削除キー/
■9876 / inTopicNo.15)  Re[12]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ ・ス・ス・ス・ス・ス・ス・スK -(2016/06/01(Wed) 19:25:50)
    あれ、異字体の認識を勘違いしていたようです。
    私用領域=異字体は間違いですね。
    https://www.kthree.co.jp/kiri/ct_product/kiri10/new_features.html

    つまり使用領域もダメで異字体も対応していないという事か・・・
    ますますUTF-16経由じゃないと駄目ですね^^;

    ありがとうございます。
引用返信 [メール受信/OFF] 削除キー/
■9877 / inTopicNo.16)  Re[13]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ モモンガ -(2016/06/01(Wed) 19:30:45)
    ↑ Name=モモンガでした。
    (名前が化けてしまいました。)
引用返信 [メール受信/OFF] 削除キー/
■9878 / inTopicNo.17)  Re[14]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ ONnoji -(2016/06/01(Wed) 21:35:15)
    2016/06/02(Thu) 10:16:01 編集(投稿者)
    2016/06/01(Wed) 21:37:11 編集(投稿者)

    > ↑ Name=モモンガでした。
    > (名前が化けてしまいました。)

    投稿する時にセットした削除キーで、投稿者の名前もタイトルも記事内容っも再編集出来ますよ。

    つまり、削除キー(半角8文字以内)は再編集に利用できますので省略しないことをお勧めします。
438×94 => 250×53

2016-06-01-01.JPG
/6KB
引用返信 [メール受信/OFF] 削除キー/
■9879 / inTopicNo.18)  Re[15]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ モモンガ -(2016/06/03(Fri) 10:52:38)
    > 投稿する時にセットした削除キーで、投稿者の名前もタイトルも記事内容っも再編集出来ますよ。
    >
    > つまり、削除キー(半角8文字以内)は再編集に利用できますので省略しないことをお勧めします。

    ですよねぇ。
    最初は付けていたんですが慣れと共に省略して削除できなくなってしまいました^^;

    Unicode、S-JISについては、勉強不足な点が大きいので現地の外字等を
    入手出来次第試してみたいと思います。(いったんクローズします。)

解決済み!
引用返信 [メール受信/OFF] 削除キー/
■9880 / inTopicNo.19)  Re[16]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ ONnoji -(2016/06/03(Fri) 11:48:20)
    2016/06/03(Fri) 11:51:32 編集(投稿者)
    2016/06/03(Fri) 11:49:09 編集(投稿者)

    昨日、桐10で試してみました。

    以下はご参考までに。

    > 以下の二案を拡張子や区切り文字形式を無視して考えてください。
    >
    > (A案)桐10の表(Unicode) → シフトJisのテキスト → コンバータ → UTF-8 のテキスト
    >
    > (B案)桐10の表(Unicode) → UTF-16 little endian のテキスト → コンバータ → UTF-8 のテキスト
    >
    > A案では、桐10の表(Unicode) → シフトJisのテキスト の時点で、異体字などの付加情報が欠落するハズです。

    <添付画像の説明>

    1行め:以下のwebページで文字をコピーして、桐の表( .tbx )の項目にコピペした。

    IVSサンプルHTML | 文字情報基盤整備事業 | IPA 独立行政法人情報処理推進機構
    http://mojikiban.ipa.go.jp/1792.html

    この表( .tbx )で[書き出し:テキスト]でテキストファイルを書き出した( IVS_UFT16.txt )。

    メモ帳で IVS_UFT16.txt を開き 文字コード UTF-8 で保存した( IVS_UFT8.txt )。

    この表( .tbx )で[書き出し:CSV]でCSVファイルを書き出した( IVS.csv )。

    2行め:IVS_UFT16.txt を読み込んだ行

    3行め:IVS_UFT8.txt を読み込んだ行

    4行め:IVS.csv を読み込んだ行

    フォントが IPAmj明朝でなければ正しく表示できないのは当然だが、

    CSVファイルの文字コードはシフトJisなので、異体字などの付加情報が欠落している。


866×235 => 250×67

2016-06-02-03.jpg
/62KB
引用返信 [メール受信/OFF] 削除キー/
■9883 / inTopicNo.20)  Re[17]: 「桐ではない別のシステム」の名称を具体的に教えていただけないでしょうか?
□投稿者/ モモンガ -(2016/06/07(Tue) 19:21:27)
    外字についても先方の扱っているUnicodeの私用領域がS-JIS外字の領域を
    超えている事がわかりA案では無理だと判断しました。

    桐10で確認して頂いた通り異字体についても問題があるようですので、
    B案で進めたいと思います。

    ありがとうございました。
解決済み!
引用返信 [メール受信/OFF] 削除キー/



トピック内ページ移動 / << 0 >>

このトピックに書きこむ

過去ログには書き込み不可

Mode/  Pass/

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

- Child Tree -
- Antispam Version -