(現在 過去ログ29 を表示中)

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

[ 最新記事及び返信フォームをトピックトップへ ]

■4544 / inTopicNo.1)  レコードの連結
  
□投稿者/ まえだ -(2009/03/31(Tue) 20:42:27)
    お世話になります。
    PDFをスキャンしデータベースに変換しております。
    文章ですので特定の列には任意の文字数で改行してあり、この行数を”1行”にまとめたいのですが、データベースのレコードを連結することは可能でしょうか。

    <内容>
    ID 商品名  処理番号   組成    備考       
    100      1   形状    あああああ
    100      2      いい
    100      3      うううう
    100      4   内容    AAA
    100      5         NNN
    100      6   適用    ええ
    100      8         おお
    200      9   形状    かかか
    200      10      きき
    200      11      くくく
    200      12   内容    DDD
    200      13         GGGG
    200      14   適用    た
    200      15         つつつ

    以上の様なデータベースを次のように修正したいのです。
    ID 処理番号 組成 備考       項目
    100        形状             あああああいいうううう
    100        内容             AAANNN
    100        適用             ええおお
    200        形状             かかかくくききき
    200        内容             DDGGGG
    300        適用             たつつつ


    この処理が出来たら次に[ID],[形状],[内容],[適用]のデータベース構造にID毎に変換作業を進めたいのですが、作業手順をご教授ください。

引用返信 [メール受信/OFF] 削除キー/
■4545 / inTopicNo.2)  Re[1]: レコードの連結
□投稿者/ 今村 誠 -(2009/03/31(Tue) 21:42:08)
    まえださんこんにちは、サンプルは見にくくてどこが項目の区切り
    か解りません。
     表で作っているならそのまま添付していただけると、他の方から
    の回答がつきやすくなると思います。

引用返信 [メール受信/OFF] 削除キー/
■4546 / inTopicNo.3)  Re[2]: レコードの連結
□投稿者/ 今村 誠 -(2009/04/01(Wed) 01:37:42)
    100,1,"形状","あああああ"
    100,2,"形状","いい"
    100,3,"形状","うううう"
    100,4,"内容","AAA"
    100,5,"内容","NNN"
    100,6,"適用","ええ"
    100,8,"適用","おお"
    200,9,"形状","かかか"
    200,10,"形状","きき"
    200,11,"形状","くくく"
    200,12,"内容","DDD"
    200,13,"内容","GGGG"
    200,14,"適用","た"
    200,15,"適用","つつつ"
    テキストファイルからこういう表を作って#直前値 関数で備考の文字を
    連結して索引で降順で並び替え後「組成」で絞り込み単一化して書き出し
    表で2行の表になりそうです。
    ファイル名入力と印字コマンドを研究すればいいでしょう。
引用返信 [メール受信/OFF] 削除キー/
■4547 / inTopicNo.4)  Re[1]: レコードの連結
□投稿者/ 通りすがり -(2009/04/01(Wed) 09:10:37)
    今村さん が既に書いてる通りだけど、、

    [備考]を置換:#COND([組成]<>#UNDEF,[],1,#直前値([],"")+[])

    [組成]を置換:#COND([]<>#UNDEF,[],1,#直前値([],""))

    並べ替え:[ID]昇順,[処理番号]降順

    単一化:[ID],[組成]


    P.S.
    ところで、以前、フォームでマウスホイールのスクロールが効かないって質問してたの まえださん でしたっけ?
    ELECOM のサイトからマウスユーティリティ泥棒してきて、一応満足に使えてるよ
    申し訳ない事をした、今は反省している、女なら誰でも良かった
引用返信 [メール受信/OFF] 削除キー/
■4548 / inTopicNo.5)  Re[2]: レコードの連結
□投稿者/ まえだ -(2009/04/01(Wed) 09:39:08)
    ありがとうございます。

    結合 yakuzai
    印字開始 "yakuzai.txt"
     繰り返し ( .Not #終端行 )
      条件 ([組成]=”用量”) 印字 [備考],
      ジャンプ 行番号 = 次行
     繰り返し終了
    印字終了
    終了 表 編集対象表

    この処理で”用量”のレコードを1行に連結することが出来ました。あとはID毎のデータ作成で作業できそうです。

    通りすがりさん、ELECOMの情報ありがとうございます。探してみます。
引用返信 [メール受信/OFF] 削除キー/
■4550 / inTopicNo.6)  Re[1]: レコードの連結
□投稿者/ まえだ -(2009/04/01(Wed) 23:35:31)
    みなさんお世話になりました。
    先にお詫びしておきます。著作権の問題がありますので実際のデータで質問できずに申し訳ありません。

    1.文章をスキャンし、データベースに移行することを考慮し、EXCELで[ID][処理番号]を追加したデータを作成しました。

    No4544に返信(まえださんの記事)
    > お世話になります。
    > PDFをスキャンしデータベースに変換しております。
    > 文章ですので特定の列には任意の文字数で改行してあり、この行数を”1行”にまとめたいのですが、データベースのレコードを連結することは可能でしょうか。
    >
    > <内容>
    > ID 商品名  処理番号   組成    備考       
    > 100      1   形状    あああああ
    > 100      2      いい
    > 100      3      うううう

    今回、このデータベースを次の様に表に書き出しました。
    ID 商品名  処理番号   組成    備考  作業     
    100      1   形状    あああああ  100
    100      2   形状      いい
    200      1   形状    あああああ  200
    200      2   形状      いい
    この表をアナログですが一括処理で次のように行いました。
    表 temp
    変数宣言 数値,固有{&I},文字列,固有{&なかみ}
    絞込み [組成]=形状
    印字開始 "yakuzai.txt"
     繰り返し (.Not #終端行)
      ケース開始
      ケース ([組成]=形状)
        条件 ([作業]>1)    印字 [作業],",",
        条件 ([作業]>1)    印字 [備考],
         ジャンプ 行番号 = 次行
        条件 ([作業]<1)     印字 [備考]
        条件 ([作業]<1)     ジャンプ 行番号 = 次行
      ケース終了
     繰り返し終了
    印字終了
    終了 表 編集対象表
    この作業を行いましたら
    100,あああああ  いい
    200,あああああ  いい
    .
    .

    このテキストを[組成]=形状 次に[組成]=用法 などと作業し、テキストファイルを個別に保存しました。
    これで何とかデータベース化が出来そうな段階にいけそうです。
    貴重なアドバイスありがとうございました。

    (この作業に2週間も費やしました・・・・)



解決済み!
引用返信 [メール受信/OFF] 削除キー/
■4551 / inTopicNo.7)  Re[2]: レコードの連結
□投稿者/ 今村 誠 -(2009/04/02(Thu) 00:28:57)
    まえださんこんにちは、例示が中途半端だからレスが付きにくいのです。
    スキャンデータとエクセルでの加工データが混在しているようですが
    IDや処理番号は桐で付加すべきデータでスキャンデータには
    商品名と組成と備考だけじゃないのですか?
    一応最初の投稿に合わせて一括を組みましたが、読み込み順に処理番号
    を振ることは簡単であり、IDも順番が決まっていれば次の「形状」が
    出現した時点で次の番号に変更が可能なので、そういう意味で実データ
    を要求しているわけではないのです。
     用は規則性の問題です。
    1)項目名にはスペースを含まない
    >商品名    組成    備考       

    2)商品名や備考などのデータにはスペースを途中に含まない
    >ペニシリン  形状    あああああ
    >赤チン          いい
    >便座         うううう
    >投薬     内容       きき
    >バッファ琳          いい

    という2つの規則がはっきりしている内容であればPDFを範囲指定して
    名前を付けて保存すれば桐でファイル読み込みと同時に処理番号やIDを
    付加して作業表を作成しNo4529 の一括処理を参考に最終目的まで一度
    に処理可能です。

    掲示板の例示部分をコピーして"mae.txt"で保存します。

    var Str { &SSTR , &Smoto = "mae.txt" , &Steigi = "定義.k3" \
     , &Sdata = "data.k3" , &S直前値 , &Stemptbl = "作業.tbl"}\
     ,Int{&Iitem=0}
    var str { &SC = "," , &SQCQ = """" + "," + """" \
     , &SCQ = "," + """" , &SQC = """" + "," , &SQ = """" }
    ファイル削除 &Steigi
    ファイル削除 &Sdata
    /*┏*/ 印字開始 &Steigi,終了状態=&実行リターン
    /*┃*/  印字 "###"
    /*┃*/  印字 "### WIN桐 00"
    /*┃*/  印字 "###"
    /*┗*/ 印字終了
    /*┏*/ファイル入力開始 &Smoto,終了状態=&実行リターン
    /*┃┏*/while (&実行リターン=1)
    /*┃┃*/ ファイル入力 &STR,行,終了状態=&実行リターン
    /*┃┃*/ &STR=#trim(#S(&STR," "," "),3)
    /*┃┃*/ &SSTR=#SSTR(&STR,1,#文字位置(&STR," ")-1)
    /*┃┃┏*/while (&SSTR<>"")
    /*┃┃┃┏*/if (&SSTR="ID") /* 項目名の最初の出現名 */
    /*┃┃┃┃*/  call 分割項目名(&STR,&SSTR,&Steigi,&Iitem)
    /*┃┃┃┣*/else /* 項目名行でない場合(データ行の場合) */
    /*┃┃┃┃*/  call 分割データ(&STR,&SSTR,&S直前値,&Sdata)
    /*┃┃┃┗*/end
    /*┃┃┗*/end  
    /*┃┗*/end
    /*┗*/ファイル入力終了
     表作成 &Stemptbl, 定義ファイル=&Steigi\
        , データファイル=&Sdata,モード=専有\
        , 終了状態 = &実行リターン
     表形式編集

    proc 分割項目名(Str &S元文字,参照 Str &S分割\
           ,Str &Sfile名,refer Int &I項目数)
     var str{&Stemp}
     印字開始 &Sfile名,追加,終了状態=&実行リターン
      while (&S元文字<>"")
        &Stemp=&SQ+&S分割+&SQ
       印字 &Stemp,&SCQ,"文字列",&SQCQ,"M1482",&SQ
       &S元文字 = #trim(#sstr(&S元文字,#L(&S分割)+1),3)
       &S分割 = #cond(#文字位置(&S元文字," ")>0\
          ,#SSTR(&S元文字,1,#文字位置(&S元文字," ")-1),1,&S元文字)
       &I項目数 = &I項目数 + 1
      end
     印字終了
    end
    proc 分割データ(Str &S元文字,参照 Str &S分割\
           ,refer Str &S直前値,Str &Sfile名)
     var str{&Stemp},Int{&Icount=0}
      while (&S元文字<>"")
       &Icount = &Icount + 1
       if (#IS数字(&S分割,1)=1)
        if (&Icount = 1)
         &Stemp = &Stemp + &SCQ + &S分割 + &SQCQ + &SQ
        else
         &Stemp=&Stemp+&SC+&S分割
        end
       else
        if (#文字位置(&STR,"形状")+#文字位置(&STR,"内容")\
                   +#文字位置(&STR,"適用")>0)
          &Stemp=&Stemp+&SCQ+&S分割+&SQ
        else
         if (&Icount = 1)
          &Stemp = &Stemp + &SCQ + &S分割 + &SQCQ + &SQC
         else if (&Icount <>3)
          &Stemp=&Stemp+&SCQ+&S分割+&SQ
         else
          &Stemp=&Stemp+&SCQ+&S直前値+&SQCQ+&S分割+&SQ
         end
        end
       end
       &S元文字 = #trim(#sstr(&S元文字,#L(&S分割)+1),3)
       &S分割 = #cond(#文字位置(&S元文字," ")>0\
       ,#SSTR(&S元文字,1,#文字位置(&S元文字," ")-1),1,&S元文字)
       &S直前値=#COND(#対応番号("形状,内容,適用",&S分割)>0,&S分割\
           ,1,&S直前値)
      end
     印字開始 &Sfile名,追加,終了状態=&実行リターン
     印字 #sstr(&Stemp,2)
     印字終了
    end
引用返信 [メール受信/OFF] 削除キー/
■4552 / inTopicNo.8)  Re[3]: レコードの連結
□投稿者/ まえだ -(2009/04/02(Thu) 08:24:08)
    今村さんいつもお世話になります。

    > スキャンデータとエクセルでの加工データが混在しているようですが
    > IDや処理番号は桐で付加すべきデータでスキャンデータには
    > 商品名と組成と備考だけじゃないのですか?
    そのとおりです、スキャンデータには項目と内容だけです。


    > という2つの規則がはっきりしている内容であればPDFを範囲指定して
    > 名前を付けて保存すれば桐でファイル読み込みと同時に処理番号やIDを
    > 付加して作業表を作成しNo4529 の一括処理を参考に最終目的まで一度
    > に処理可能です。

    PDFを直接桐から読めるのでしょうか?
    今回の作業には、PDFを「読んdeここ」でテキスト変換し、桐で作業する目的で「ID」と連番をエクセルで追加しました。

引用返信 [メール受信/OFF] 削除キー/
■4553 / inTopicNo.9)  Re[4]: レコードの連結
□投稿者/ 今村 誠 -(2009/04/02(Thu) 08:43:56)
    まえださんこんにちは
    >>商品名と組成と備考だけじゃないのですか?
    > そのとおりです、スキャンデータには項目と内容だけです。
    >
    > PDFを直接桐から読めるのでしょうか?

    それは無理で、アドビのアクロバットのリーダーで直接
    マウスで範囲指定してテキストを読み込むと思っていました。

    >1) 今回の作業には、PDFを「読んdeここ」でテキスト変換し、
    >2) 桐で作業する目的で「ID」と連番をエクセルで追加しました。

    1)を実行したデータを都合の悪い部分だけを違う文字に変更して
     貼り付けてもらって質問されていると、エクセルを起動することなく
     IDや処理番号は桐で付加するべきデータだと申し上げています。

    加工済みをもう一度桐で処理するのは大変だと思います。
    読んでココがどのようなデータをはき出すのかは解りませんが
    私の述べた規則に殆ど近いのであれば、エクセルで加工する必要は
    ないと思います。

    商品名があるデータを省かれて一括を組むことは、2度手間3度手間で
    だれも例示したくなくなるわけです。

    元が悪いのに完成まで書いても報われないわけです。

    私の推測はあながち間違っていないのじゃないでしょうか。
引用返信 [メール受信/OFF] 削除キー/
■4555 / inTopicNo.10)  Re[1]: レコードの連結
□投稿者/ まえだ -(2009/04/02(Thu) 21:56:06)
    お世話になります。

    参考までに一部を添付しました。
    件数は大まかですが 15ファイル×100ページ×4〜10アイテム=最小6000件〜最大15000件(多分17000件程度)

    サンプルAの適応に連続性はなく、任意の位置で改行されています。
    サンプルBは”A”のように●の記号もありません。
    このファイルから「適応」の文章を”ああああああ”商品名、適応項目は・・・・・・のように1レコードとして処理したいのですが、その前段階である複数行にまたがった文章を1つの連続した文章に再構成したいと考えたのですが、方法が間違っていますでしょうか。

1238676966.txt
/1KB
引用返信 [メール受信/OFF] 削除キー/
■4556 / inTopicNo.11)  Re[2]: レコードの連結
□投稿者/ 今村 まこと -(2009/04/02(Thu) 22:51:56)
    まえださんこんにちは
    > サンプルAの適応に連続性はなく、任意の位置で改行されています。
    > サンプルBは”A”のように●の記号もありません。
    > このファイルから「適応」の文章を”ああああああ”商品名、適応項目は・・・・・・のように1レコードとして処理したいのですが、
    その前段階である複数行にまたがった文章を1つの連続した文章に
    再構成したいと考えたのですが、方法が間違っていますでしょうか。

    商品名は1行目にあり必要な部分は適応以下の文書であるということですか。
    【相互作用】や【薬物動態】の文字が次の区分に私には見えます。
    サンプルAとサンプルBは別ファイルである。
    【】を区切り文字にすることは可能です。
    必要な文字が【適応】であれば行の文字中にあれば其処は必要な行で
    次の【が来るまでを取り出す

    何が必要かの部分が 「商品名」【組成】と【用量】「適応」なら
    取り出し可能ですね。
    後の部分はばらばらですよね。

    取り出すのは私ではないので、ファイルの形式もわかりませんし、
    どれくらいばらばらで、どれとどれがいるという表現でないと

    最初のサンプルと今回のサンプルでは改行の考え方も変わりますね。

    基本的には区切り文字が出現したら変数に代入し次の区切り文字が
    来るまで連結する
    商品名は必ず先頭1行に来るようにする、あるいはテキスト保存する
    ときに、ファイル名にしてしまう
    読み込んだテキストファイルはひとつのフォルダーにまとめる
    というように桐で一度にできる工夫が必要です。
    対応可能な部分や補足する部分があればコメントされるとエクセルを
    途中で使うよりもっと良い方法が掲示されるでしょう。
引用返信 [メール受信/OFF] 削除キー/
■4557 / inTopicNo.12)  フォームを考えよう
□投稿者/ 今村 誠 -(2009/04/02(Thu) 23:17:57)
    どういう商品があって
    特徴1
    特徴2
    特徴3
    用途
    副作用

    見たいに単票のカード形式に表示させデータが空白の場合はタイトルオンリー
    たくさんの文字がある場合は行数を自動で増やす、というようにしたら
    見やすいですね。
     私のページの簡易メニューと4択問題集はそのような画面です。
    取り出したい項目を【】ごとに無作為に取り出したらよいのではないでしょうか。
    【】が無いファイルというかデータはエディターで整形するか、整形専用の
    桐のフォームに貼り付け検索キーワードを多遊さんの桐hpbの太字や斜体の
    ような一発変換のコマンドボタンを明細文字ごとに作成する。
    もちろん保存ボタンも同時に作成する。分類ごとに保存するのか商品名ごとに
    保存するのかわかりませんが、アイデアが次々思いつきます。

    エクセルでボツボツ手直しよりはるかに効率の上がる方法だと思います。

    まず項目名(分類)と閲覧フォームを作成して整理したらよいと思います。
引用返信 [メール受信/OFF] 削除キー/
■4558 / inTopicNo.13)  整形フォームが味噌なのでは
□投稿者/ 今村 誠 -(2009/04/02(Thu) 23:40:31)
    PDFが1商品ごとの読み込みなら、桐でフォームを作成し貼り付けて
    整形ボタンを作成し蓄積テーブルにイベントで追加保存していくというのが
    一番簡単な気がします。

    まず蓄積テーブルの作成と 薬の効能や用量は項目名として公開しても
    著作権には触れないのではないでしょうか。
     後は貼り付けたデータからキーワードの整形をいかに簡単に作りイベント
    で印字コマンドを使い蓄積データに整形するかじゃないでしょうか。

    PDFが一品一葉なら単票フォームの作成が早道だと思います。
引用返信 [メール受信/OFF] 削除キー/
■4559 / inTopicNo.14)  用語の説明
□投稿者/ 今村 誠 -(2009/04/03(Fri) 00:48:13)
    > 15ファイル×100ページ×4〜10アイテム
    アイテムとは項目名で
    ページとは1商品のことで
    15ファイルとは1500品あるということですか。
    また、読んでココで作成したページですか
    今から作成する元pdfのページ数のことですか
    読んでココはページをテキストファイルに変換するときに
    どのようなページ概念で変換するのですか。
    たとえば1行目の商品名をファイル名としてテキストファイルに
    書き出してくれるなら作業は格段にはかどりますね。
    今のデータだと前の商品と次の商品名の間を判別するのは
    3行の改行が連続していたらとしか受け取れません。
引用返信 [メール受信/OFF] 削除キー/
■4562 / inTopicNo.15)  Re[1]: レコードの連結
□投稿者/ ONnoji -(2009/04/03(Fri) 16:44:46)
    2009/04/03(Fri) 16:59:25 編集(投稿者)
    2009/04/03(Fri) 16:54:24 編集(投稿者)

    テキストの薬剤Aと薬剤Bの境界に、1つ以上の空行がありますか??

    空行があれば、なんとかなりそうですが…。

    それから、

    名称,●,【組成】,【剤形】,【用量】,【特徴】,【適応】,【薬物動態】,【副作用】,【隋証】,【相互作用】

    の要素以外のデータが現れますか??

    最終的に表( .tbl )の

    [名称],[●],[組成],[剤形],[用量],[特徴],[適応],[薬物動態],[副作用],[隋証],[相互作用]

    の各項目にデータが入れば良いのですよね。


引用返信 [メール受信/OFF] 削除キー/
■4563 / inTopicNo.16)  Re[2]: レコードの連結
□投稿者/ eo -(2009/04/03(Fri) 16:54:28)
    2009/04/03(Fri) 16:57:49 編集(投稿者)

    > このファイルから「適応」の文章を”ああああああ”商品名、適応項目は・・・・・・のように1レコードとして処理したいのですが、その前段階である複数行にまたがった文章を1つの連続した文章に再構成したいと考えたのですが、方法が間違っていますでしょうか。

    手作業が多いのですが…以下で改行はとれます。
    ■サンプルのテキストをtxt.tblの[テキスト]項目に読み込む。
    ■[整形]項目で<BR>タグを付加する。
    ■[整形]項目をテキスト書き出しで整形.htmlとして書き出す。
    ■webブラウザで整形.htmlを開く。
    ■すべて選択してコピー。
    ■エディタで新規テキスト(整形.txt)を作成し貼り付けで改行がとれます。
    さ〜て、これからどうしましょ^^;


txt.zip
/6KB
引用返信 [メール受信/OFF] 削除キー/
■4564 / inTopicNo.17)  Re[3]: 用語の説明
□投稿者/ 今村 誠 -(2009/04/03(Fri) 18:44:52)
    まえださんこんにちは解決済みですがアドバイスが必要なければ
    もう一度誰の所でも良いので返信して解決済みとして下さい。

    > 今のデータだと前の商品と次の商品名の間を判別するのは
    > 3行の改行が連続していたらとしか受け取れません。

    区分というか項目名はサンプルのように同じ行には存在しない
    と判断できるのでしょうか。
    それとも、下記のように

    ああああああああ
    【組成】[妊B]【剤形】注:20万単位  注:100万単位【用量】18g
    【特徴】狭域性.グラム陽性菌用.ペニシリナーゼに不安定

    同じ行に2つも3つも存在するのでしょうか。

    商品の区切りと項目の区切りは一番重要な要素です。
    ここが曖昧なままプログラムは作れません。
引用返信 [メール受信/OFF] 削除キー/
■4565 / inTopicNo.18)  一応、でけたよ
□投稿者/ 通りすがり -(2009/04/03(Fri) 19:20:29)
    もともとIDも処理番号も入ってないテキストだね
    テキスト整形は普通に正規表現使えるエディタとかが良いんでないの?

    MS Word でも以下で出来たけど、、かなりカッコ悪い…、よりスマートに出来そう

    先頭に改行4つ入れる
    <*> → [ナシ]
    ^p^p^p^p^p → ^pZZ
    <(ZZ?*)> → \1ZZ
    ^P → [ナシ]
    ZZ → ^p
    【 → ^p【

    --以上での変換結果--
    ↓↓

    ああああああああ

    抗菌薬 ペニシリン系薬ベンジルペニシリンカリウム benzylpenicillin potassium(PCG)●注射用ペニシリンGカリウム (明治製菓)  
    【組成】[妊B]
    【剤形】注:20万単位  注:100万単位
    【用量】(1)(2)1回30万〜60万単位,1日2〜4回筋注〔生理食塩液〕〔注射用水〕  (2)通常用量より大量使用  ◆小児:1日(1)5万単位/kg,2〜4回分割静注.(2)25〜30万単位/kg,6回分割静注
    【特徴】狭域性.グラム陽性菌用.ペニシリナーゼに不安定
    【適応】(菌)ブドウ球菌属,レンサ球菌属,肺炎球菌,腸球菌属,淋菌,髄膜炎菌,ジフテリア菌,炭疽菌,放線菌,破傷風菌,ガス壊疽菌群,回帰熱ボレリア,ワイル病レプトスピラ,鼠咬症スピリルム (症)(1)表在性・深在性皮膚感染症,リンパ管・リンパ節炎,乳腺炎,咽頭・喉頭炎,扁桃炎,急性気管支炎,肺炎,肺膿瘍,膿胸,慢性呼吸器病変の二次感染,淋菌感染症,中耳炎,副鼻腔炎,猩紅熱,炭疽,ジフテリア(抗毒素併用),鼠咬症,破傷風(抗毒素併用),ガス壊疽(抗毒素併用),放線菌症,回帰熱,ワイル病.(2)敗血症,感染性心内膜炎,化膿性髄膜炎
    【薬物動態】尿中排泄49%(3時間) (最高)40万単位筋注15分
    【副作用】[重大]ショック.溶血性貧血.無顆粒球症.出血性膀胱炎.急性腎不全.(腎不全患者に大量投与)痙攣.偽膜性大腸炎.皮膚粘膜眼症候群,中毒性表皮壊死症[その他]発熱,発疹,蕁麻疹.好酸球増多症,顆粒球減少,Plt減少,貧血.AST上昇など

    いいいいいいいい

    漢方薬 その他黄耆建中湯(オウギケンチュウトウ)ツムラ顆粒(98) (ツムラ)  
    【組成】シャクヤク 6.0オウギ 4.0ケイヒ 4.0タイソウ 4.0カンゾウ 2.0ショウキョウ 1.0
    【用量】18g
    【適応】虚弱体質,病後の衰弱,寝汗〔身体虚弱で,疲労しやすいものの諸症〕
    【相互作用】安中散参照
    【副作用】安中散参照
    【隋証】陰,虚[参照先]
    【相互作用】カンゾウ・グリチルリチン酸製剤(偽アルドステロン症,ミオパシー)
    【副作用】[重大]偽アルドステロン症,ミオパシー[その他]発疹,発赤,そう痒など

引用返信 [メール受信/OFF] 削除キー/
■4566 / inTopicNo.19)  Re[3]: レコードの連結
□投稿者/ eo -(2009/04/04(Sat) 09:50:33)
    おもいきって1品目1レコードの構造ではなく、ヘッダと明細の構造にする手はダメかな^^;
    これなら簡単にできるし汎用性もあるような…


1238806233.zip
/5KB
引用返信 [メール受信/OFF] 削除キー/
■4567 / inTopicNo.20)  感想
□投稿者/ Kanasy.Ge -(2009/04/04(Sat) 11:56:01)
     処理方法の細部についてではなく、全体的な感想という形でコメントさせていただきます。

     まえださんが、どのpdfデータを利用しているのかは判りませんし、ま、判る必要もないのですが(^^;)、いずれにせよ、データの中味がこのような「医薬品情報」なのであるのならば、
    (1)まずpdfデータをスキャンして「読んdeここ」でテキスト変換したものを(エクセル経由で?)処理しようという、前段の過程がどうにも腑に落ちません。

    その上で、eoさんのhtml経由という発想も踏まえて、
    (2)この種の情報の元と言うべき詳細データが公開されています(文字どおり「公」です)。
    http://www.info.pmda.go.jp/psearch/html/menu_tenpu_base.html
    ので、このデータをコピペすれば(スキャン→変換の過程を経ずとも)各アイテムのテキストを取得することが出来ます。あるいはDTMやSGMファイルとしてダウンロードすることもできるようになっていますし、もちろんhtmlのまま保存することもできます。

     テキストの不要な部分は、手動で削除することになろうと思いますが、少なくともスキャン→変換の過程よりは楽だし、何と言っても正確なはずです。
    (3)肝心の最終的に桐に取り込む過程については、また別途の検討に任せるとして、ひとつだけ案を記してみます。DTMやSGMは全く判らないのでhtml(テキストとしてのhtml)についてだけですが、項目名相当として<h4>〜</h4>、項目値としては<dd>〜</dd>辺りのタグを判定にうまいこと利用できないだろうか? いえ、まったく試してませんが。

    (4)ついでに、ONnojiさんのNo.4562に、私の勝手な想像でコメントしますと(^^;)、この種のデータの場合、項目構成はかなり「不定に近い」と考えたほうがいいような気がします。いえ、最終的には不定ではないのだが、何が出てくるかはかなり試行錯誤しないと判らない。それと、1アイテムを1レコードにするには、桐の仕様である4000文字/レコードの壁に早晩ぶつかるような気がします。
     って、勝手にこんなことコメントしちゃってすいません。間違ってるかもしれませんよね。

引用返信 [メール受信/OFF] 削除キー/

次の20件>

トピック内ページ移動 / << 0 | 1 >>

[このトピックに返信]
Mode/  Pass/

HOME HELP 新規作成 新着記事 トピック表示 ファイル一覧 検索 過去ログ

- Child Tree -
- Antispam Version -