Python×医療事務(×トロント)

#医療 / #医療事務 / #IT / #トロント / #歯科助手 / #のんびり / #備忘録 / #趣味

電子カルテ 開発 事前準備 ③

はじめに

続きです

 

chocolate22554.hatenablog.com

chocolate22554.hatenablog.com

 

 

内容

(自分なりに和訳している部分あります)

下記 記事は 構成の図 等 シンプルだけども どういう構成で使っていくか書かれていてよかったです

https://vixra.org/pdf/1909.0407v1.pdf

↓以降は文章中で出現する単語等を調べたりしたもの

 

Spacy(ライブラリ)  等 使っている模様

高度な自然言語処理を行うためのライブラリ

spaCy · Industrial-strength Natural Language Processing in Python

参考

 

qiita.com

 

Theorem Prover

ウィキペディア

https://slidesplayer.net/slide/11332742/

 

QRNG Concepts

Quantum Random Number Generation = QRANGE

低価格、高速 且つセキュリティー性の高いランダムな数字のことをQRANGEという模様

時間かかりそうなんで詳しくは飛ばします

 

The LLVM Compiler Infrastructure Project

 

XML

Extensible Markup Language (XML)

 

Base X

 

HPC -High Performance Computing高性能計算 - Wikipedia  

 

 

今回の文書で貼り付けられていたサイトについてhbr.org 

海外の電子カルテについてもお金を気にしたりしているようで、海外はオープンソース公開している部分もあるけども やはり 日本だけでなく海外も電子カルテ等 医療の出費は高い様子

違いは日本は医療費に割いてないこと

 

 

Yale University(大学)のもの

SciSpacy and Stanza    を使っていくパターン

yale-lily.github.io

 

コード

github.com

 

 

 

 

 

まとめ

機械学習を組み込んだ電子カルテを作っていくに当たり構成等を学び

海外の医療業界(電子カルテ業界)の現状を学んだ

知らないものもあり今回はじめて知ったものもあるので勉強になった

次回は  Gitにて公開されているコードをみていく か 下記サイトの

chocolate22554.hatenablog.com

(ICD10 codes

International Classification of Diseases (ICD)


, SNOMED CT) & What to expect in the Future

SNOMED CT - Wikipedia

を調べているときに 電子カルテの背景にある構成が おそらく これを基準に日本も作られているのでその辺りを調べる  ことにします


 

 

今現在の英語力==カナダから帰国して4年

はじめに

カナダから帰国して4年ぐらい経ってしまったので今現在の英語力を備忘録も兼ねて記載したいなとつくづく思っていたので記載するに至りました

 

内容

☑環境

今現在の環境としては 英語を使うのはほとんど皆無という状況

 

☑Reading

pythonを勉強しているので、英語記事を読んだり 

医療に関わっているので英語の記事を読んだりすることは時々だったりある

ネットサーフィンで英語記事を読むこともある

読む分には日本語と同じで 気力残ってればスラスラ読めるし、疲れてれば理解力は落ちる

前後の単語からおおよそ推測して脈絡把握したり、違うように捉えてることもある

それについてはカナダ行く前にもあったきもするし居るときもあった気がする

違いとしてはカナダに居るときより 英語読むスピードは遅い気がする

以前からかもしれないが、重点部分だけをピックアップするスピードは少し遅くなったかもしれない

 

☑Listening

カナダ行く前から 何故か聞き取れてはいた

今現在 カナダ行く前のレベルではないがやはりネイティブの英語は集中しないとキツイ

特にビジネスは ヘラヘラしゃべれないのでキツイ

Speaking含めて 元々 勢いとやる気でしていたが、聞き取れるけど Native要素が大きくなると聞き取りが若干追いつかなくなる

カナダから日本に帰国する日ぐらいの段階で Nativeが見ている 英語バラエティーとか笑って見れていたので、今でも理解できるといえば理解できるけど4割〜6割 落ちている感覚

 

☑Speaking

元々 やる気と根性でしていたが 全くと言っていいほど機会がないので 

日本人特有のものもあるかもしれないが 一番 自信が少し低下している部分

Speakingが皆無なので、今後の英語の使いようをどのようにするかによるが 迷っている部分 

 

 

まとめ

pythonで英語にふれる機会が多いことと 職場でも外国の方を本当にたまに 受付等することがあるので、なんとか 楽しめる程度には 英語が使えている状況

今段階でカナダに行くとなった場合、 カナダ行く前の4−5年前よりは 予備知識があり 且つ英語力もあると思うが カナダに居るときに憧れていた 半永住権には程遠いレベルだと思います

今現在 趣味レベル?なので、今後も趣味レベルにするのか考え中です

しかし 英語を学んでいて カナダに行って 悪かったことはなく、今現在の状況等におおいに活用できているので行ってよかったと今でも思います

 

 

電子カルテ 開発 事前準備 ②

はじめに

前回の続きです

機械学習を搭載している電子カルテを作成していくにあたって調べています

chocolate22554.hatenablog.com

 

内容

いくつか参考記事があったのだが 先にGitでリポジトリ公開されており、チュートリアルもあり、わかりやすい記事があった MedCATから

towardsdatascience.com

この方は大規模なサーバーやインフラなしでMedCATというGitで公開されている電子カルテ MedCATを元に進めていく模様

   GitHub - CogStack/MedCAT: Medical Concept Annotation Tool 

 

 

いろんな病院のEHR(Electronic Health Record  電子カルテの略)のデータ

Google Health unveils EHR data aggregation tool for clinicians

Amazon Comprehend Medical | AWS

(下記からは自分なりに英語を意訳したもの 和訳すると違う意味だがなんとなくで訳してまとめている)

 MedCAT   チュートリアルの全体像

  1. Introduction — 

    GitHub - CogStack/MedCATtutorials: General tutorials for the setup and use of MedCAT.

  2. Dataset Analysis and Preparation — データ分析と準備
    ML projectについて、  データセットについて, 事前処理テキスト、モデリングを始める前にするすべてのこと
  3. Extracting Diseases from Electronic Health Records 電子カルテから疾患の抽出
     MedCAT のライブラリ(python)、固有表現認識(テキストから人名、日付等の固有表表現を抽出するタスク            

    アノテートされたデータがないドメインで固有表現認識!?https://ai-scholar.tech › ner-weak-supervision        )  
     ,
    医学概念(medical concepts)とつなげる。
    <MEDCATをどのように使いたいを知るなら この3番で十分ということ
  4. Analysing the Results
    中級・上級レベルのMedCAT ライブラリの部分   
    NER+L & MetaAnnotations のための完璧なパイプラインを構築する方法
    <Meta 使っていくんですね
  5. Analysing the Results — 分析の結果
    電子カルテから該当部分を抽出できたかどうかみていく
  6. Other Tools and Functions of the MedCAT library-----MedCATライブラリの 他のツールと機能
    (ICD10 codes

    International Classification of Diseases (ICD)


    , SNOMED CT) & What to expect in the Future

    SNOMED CT - Wikipedia

     



    https://www.jstage.jst.go.jp/article/johokanri/51/4/51_4_243/_pdf

記事内で電子カルテの記録はフリーテキストというのを何回か伝えているのですが、

電子カルテ記録の例で英語バージョンですが ぐしゃぐしゃしてますね

電子カルテはまだ形式化されているのでいいですが、紙カルテは筆跡等違うので読解が困難をきたします

自然言語処理(該当文書をどのように分けるか等色々な方法がある)

Natural Language Processing (NLP) as Named Entity Detection and Linking (NER+L)

NERは医療用語の該当箇所を分ける

NER means detecting the entity in the text

 

バイオメディカル(生物医療)のデータベースと照合させる

おそらく日本で言う 区分番号と NERで区分した 医療用語やテキスト自体を照合させ 本当に正しいか 漏れがないかを確認する

UMLSがデータが一番多いようでここではそれを使うようです

 

L means linking the recognised entity to a concept in a biomedical database

医療単語とデータベースを照合させる作業の部分はとても大事で、なぜかというと同じ様な意味を持っている単語をまとめることができるからということ。この作業がなければ例えば何人の患者さんが心臓病を持っているか 正確に数えることが難しくなるということ

The linking part is essential because it allows us to standardise and organize the detected entities, as multiple recognised entities can link to the same medical concept in a biomedical database. For example, in an EHR we can have:

 

例でいうと下記 太字の単語はすべて心臓病を指す

  • The patient was diagnosed with malignant neoplasm of breast
  • Previous medical history includes breast cancer
  • Reason for admission: breast CA
  •  

The dataset — MIMIC-III

It includes clinical notes, demographics, vital signs, laboratory tests and more

使うには申請が必要なよう、何日かで承諾されるらしい

The dataset can not be downloaded directly, but one needs tosubmit a request  first

Environment setup (if running locally)

ローカル環境で使う場合↑

主にpythonを扱う  Rを使うかもしれないし 少し補助的にJavascriptを使うと助かるかもしれないということ。

pythonは3.5以上のverであれば使えるということ

下記を行っているがvenvでなくて、Anaconda のcondaを仮想環境として使うで良さそう

$ python3 -m venv medcat

 

chocolate22554.hatenablog.com

 

まとめ

先に触れたチュートリアル 1〜5の中身が内容が充実してそうなのでもっと紐解きたいが、一旦ここまでにして次に移ります

データセットの部分等 日本でいうとどれが当てはまるか調べる必要がありそうです

必要あれば 更に記事内容を追加していく予定

 

 

 

 

電子カルテ 開発 事前準備 (①?)

はじめに

以前も調べたことあるんですが 機械学習を含んでいる電子カルテを一旦簡単に作りたくて調べました  備忘録も兼ねて記録  

 

 

記事の概要

海外でも電子カルテがシンプルでなかったりすると煩わしさを感じるんですね

simple electronic medical record system designed for research | JAMIA Open | Oxford Academic

github.com

最初ぐらいしか見てないですが どの言語も 電子カルテ作成はできるが pythonだとほかコードより文字数が少なくできるようです

(pythonベースの電子カルテを購入することも書いてますが今回 話題が違うので省きます)

https://www.quora.com/Is-it-a-good-idea-to-use-Python-to-build-EHR

 

 

英語verだと python電子カルテのコード等 Gitで公開されてます

 

electronic-health-records · GitHub Topics · GitHub

 

 

まとめ

質問等みていると 私の検索不足かもしれませんんが、日本語では広告の電子カルテのことばかり出て、開発のページが全く出ません

英語だと オープンソースは当たり前 開発している方も多く ソースが多いと感じました

python自体が英語ソースが多い言語なのでそうなのかもしれないですが、日本語の電子カルテ開発情報は少なすぎますね

一旦ここで締めくくります

Bubble 使ってみた② チュートリアル?

はじめに

前回の記事の続きです

chocolate22554.hatenablog.com

 

tour選択したら 他画面に移ったので 忘れないために引き続き 備忘録 兼ねて 記録

 

 

記事の概要

①reference と tour  と書かれていたと思うのですが下にあるtour を選択

下記画像 の画面になりました

シンプルな画面で見やすい

開発中止されましたが ATOM 思い出す

②青いボタンの start をクリック

③6つのアプリを構成していく上で使うボタンや機能の部分(違うコンセプトとエリア部分)があるようです

(そういえば 日本語 選択したのに 普通に 英語で進んでます)

④インターフェース部分(デザイン部分)

ドラッグ・アンド・ドロップでできる+パワーポイントのスライドのようにも使える模様

⑤ワークフロー部分  プログラミング部分? 詳細に設定

⑥データベース部分  データの構成や 格納されている?データを見たり修正可能

SQLのような?)

⑦スタイルやテーマを決める部分?  骨組み?フレームワークのような場所?

API と Plugin?を追加したりできるタブ

 

⑨設定タブ  アプリの設定変更  自分のアプリがWeb上でどのように見えるか等 設定できる

⑩ダブルクリック等して 配置等 変えれる

⑪タイトル等 変えれる

⑫説明している最中でしたが、どこかのボタン押して ページ遷移してしまい Home画面に一旦戻ることにしました

アプリ作成はまた今度していきます

 

 

▶▶続く