(現在 過去ログ86 を表示中)

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

[ 最新記事及び返信フォームをトピックトップへ ]

■12820 / inTopicNo.1)  Gboardからエクスポートしたファイル
  
□投稿者/ いぶけん -(2021/01/25(Mon) 11:23:31)
    Android版Gboardからエクスポートしたファイルを、桐で読み込むと何故か文字化けします。
    秀丸エディタで確認した時点では文字化けはなかったです。

    桐の初心者です。
    桐ver.9-2012(桐ver.9-2004 SP6)です。


    1.Gboard → 単語リスト → 日本語 → 画面右上の「・・・」 → エクスポート

    2.Gmailでzipファイル添付でpcへ送付

    3.zipファイルを解凍 → dictionary.txt

    4.エディタで内容閲覧 ※この時点では文字化けは確認されず

    5.桐 → ファイル処理 → 読み込み → テキスト

    6a.読み込み項目 [よみ][単語][JP]
      一行目を読み込まない
      タブ区切り
      前後空白削除 → 両方 → 文字化け
             → 削除なし → 文字化け
      テキストファイルをまんまコピペ
    --------------------------------------------
    # Gboard Dictionary version:1
    いーせっと ESET ja-JP
    あさか TMGあさか医療センター ja-JP
    みつい 三井住友カード ja-JP
    みつい 三井住友銀行 ja-JP
    --------------------------------------------

    6b.txtの一行目を削除し、「一行目を読み込まない」チェックを外す
       テキスト文を上記データ4行だけにして、桐から読み込む
      テキストファイルをまんまコピペ
    --------------------------------------------
    いーせっと ESET ja-JP
    あさか TMGあさか医療センター ja-JP
    みつい 三井住友カード ja-JP
    みつい 三井住友銀行 ja-JP
    --------------------------------------------

    7.CSVで書き出し結果
    よみ,単語,JP
    縺・・縺帙▲縺ィ,ESET,ja-JP
    縺ゅ&縺,,
    縺ソ縺、縺,,
    縺ソ縺、縺,,

    2行目以降の[単語][JP]は空値になっていますが、
    一番最初は[よみ]だけが文字化けしていたけれど、[単語][JP]
    は空値ではありませんでした。

    理由がわからず困っています。よろしくお願いします。
引用返信 [メール受信/OFF] 削除キー/
■12822 / inTopicNo.2)  Re[1]: Gboardからエクスポートしたファイル
□投稿者/ いぶけん -(2021/01/25(Mon) 11:36:22)
    2021/01/25(Mon) 11:38:55 編集(投稿者)
    2021/01/25(Mon) 11:38:48 編集(投稿者)

    このスレから「返信」してみると、
    Nameが文字化けしてます。
    桐が原因ではなく、OSが原因なのでしょうか。

    ちなみに、Nameは、「�ス�ス�スヤゑソス�ス�ス」になっています。
    そのまま送信すると、名前なしでエラーになります。

    前PCでも何回かこの掲示板使っていましたが、そのような症状もなく、
    現PCで他掲示板でもこのような名前とかが文字化けするような症状はみられませんでした。
引用返信 [メール受信/OFF] 削除キー/
■12823 / inTopicNo.3)  Re[2]: Gboardからエクスポートしたファイル
□投稿者/ きめつふぁん -(2021/01/25(Mon) 19:13:30)
    こんにちは。
    ネットで
    「DPZの2月の記事をすべてUTF8→SJISで文字化けさせると、「縺」は101982回も出現する。多いな・・・。」
    という記事がありました。
    エンコードって関係ありとおもいます。
    ただ、どうすれば文字化けしないかは私はわかりません。
引用返信 [メール受信/OFF] 削除キー/
■12824 / inTopicNo.4)  Re[3]: Gboardからエクスポートしたファイル
□投稿者/ いぶけん -(2021/01/25(Mon) 20:40:12)
    2021/01/25(Mon) 20:44:26 編集(投稿者)
    2021/01/25(Mon) 20:44:22 編集(投稿者)

    きめつふぁんさん、ありがとうございます。
    該当ファイルの文字コードを見たら「Unicode(UTF-8)」となっていました。
    これをエディタにて「日本語(Shift-JIS)に変換して、桐から読み込んだら文字化けはなくなりました。

    また「桐10」の「その他の新機能」として、
    --------------------------------------------------------------------
    テキスト、CSVなど外部から入力するファイルの文字コードを自動判定*
    Unicodeへの対応に合わせて、外部から読み込むファイルの文字コード自動判定機能を追加しました。
    Shift_JIS、UTF-16LE、UTF-8など通常使われる文字コードであれば、桐が自動的に識別し、読み込み時に必要な変換を行います。文字コードを意識せずにお使いいただけます。
    * 自動判定はファイルの先頭部分を見て文字コードの判断を行います。ファイルによっては判定できない場合があります
    --------------------------------------------------------------------
    というページを見つけました。

    桐9では非対応なんですね・・・・
    しかしこれだけのために「桐10」へアップグレードってコスパ高すぎ><

解決済み!
引用返信 [メール受信/OFF] 削除キー/
■12825 / inTopicNo.5)  Re[4]: Gboardからエクスポートしたファイル
□投稿者/ hidetake -(2021/01/26(Tue) 06:48:53)
    Windows では、次のような内容のテキストファイルで
    作成し、拡張子を .vbs とした VBScript ファイルを
    実行すると x:\path\UTF8.txt のテキストファイルを
    x:\path\SJIS.txt として、SHift_JIS に変換すること
    ができます。これを桐から実行し、桐に喰わせること
    で「桐9」でも処理可能となりますが、UTF-8 で表現
    できる文字で Shift_JIS で表現できない文字は
    失われてしまいます。

    UTF8toSJIS.vbs
    '---------------------------------------------------------------
    Const adTypeText = 2
    Const adSaveCreateOverWrite = 2

    Set Src = CreateObject("ADODB.Stream")
    Src.Open
    Src.Type = adTypeText
    Src.Charset = "UTF-8"
    Src.LoadFromFile "x:\path\UTF8.txt"

    Set Dst = CreateObject("ADODB.Stream")
    Dst.Open
    Dst.Type = adTypeText
    Dst.Charset = "Shift_JIS"
    Src.CopyTo Dst
    Src.Close

    Dst.SaveToFile "x:\path\SJIS.txt", adSaveCreateOverWrite
    Dst.Close

    Set Src = Nothing
    Set Dst = Nothing
    '---------------------------------------------------------------
引用返信 [メール受信/OFF] 削除キー/
■12826 / inTopicNo.6)  Re[5]: Gboardからエクスポートしたファイル
□投稿者/ いぶけん -(2021/01/26(Tue) 08:28:29)
    > UTF-8 で表現できる文字で Shift_JIS で表現できない文字は
    > 失われてしまいます。

    hidetakeさん、情報ありがとうございます。
    自分も今回の件でわかったのですが、エディタにてコード変換後、
    そのまま保存できず、手修正するかどうか聞かれてきました。
    「ヴ」はUTF-8 、Shift-JISの両方可能ですが、
    その読みである「ひらがなの「う」に濁点」がUTF-8では可能であるのに、
    Shift-JISだとエラーになるんですよね。

    「桐10」だと自動認識するらしいですが、桐の表も「UTF-8」コードでないと
    文字化けすると思うんですよね。
    ちょっとメーカーに問合せてみます。

    回答があれば本スレッドに書き込みします。
引用返信 [メール受信/OFF] 削除キー/
■12827 / inTopicNo.7)  Re[1]: Gboardからエクスポートしたファイル
□投稿者/ いぶけん -(2021/01/26(Tue) 21:53:56)
    サポセンからの回答文です。
    若干編集はしていますが、文意は変えていません。

    ---------------------------------------------------
    Q:「UTF-8」ファイル内の、「ひらがなのヴ」は、「桐10」で読み込むと、
      「桐10」ではどのように表示になるのでしょうか?

    A:まず、桐10でUTF-8のひらがなのヴを読み込んだ場合、
      そのままひらがなのヴとなります。


    Q:桐の項目値に「ひらがなのヴ」は「桐9」では入力不可能ですが、
      「桐10」では可能なのでしょうか?
       また、「桐10」でテキスト書き出しは「UTF-8」指定で書き出すことは可能でしょうか?

    A:桐10でひらがなのヴを登録することはできますが、
      どのように入力するのかは日本語入力システムに依存します。

      なお、桐10ではUTF-8への出力をサポートしておりません。
      出力はテキストファイルの場合はUTF-16、CSVファイルの場合はシフトJISになります。
    ---------------------------------------------------
引用返信 [メール受信/OFF] 削除キー/
■12828 / inTopicNo.8)  Re[2]: Gboardからエクスポートしたファイル
□投稿者/ hidetake -(2021/01/26(Tue) 22:15:08)
引用返信 [メール受信/OFF] 削除キー/



トピック内ページ移動 / << 0 >>

このトピックに書きこむ

過去ログには書き込み不可

Mode/  Pass/

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

- Child Tree -
- Antispam Version -