Die Healthcare Natural Language API ist Teil der Cloud Healthcare API, die Natural Language-Modelle verwendet, um medizinische Informationen aus medizinischem Text zu extrahieren.
In diesem konzeptionellen Leitfaden werden die Grundlagen der Verwendung der Healthcare Natural Language API erläutert. Dazu gehören:
- Die Anfragentypen, die Sie an die Healthcare Natural Language API senden können
- Wie Sie Anfragen an die Healthcare Natural Language API erstellen
- Wie Sie Antworten der Healthcare Natural Language API verwenden
Überblick
Die Healthcare Natural Language API extrahiert medizinische Informationen aus medizinischen Texten. Dazu gehören:
- Medizinische Konzepte wie Medikamente, Verfahren und Erkrankungen
- Funktionale Merkmale wie Zeitbeziehungen, Subjekte und Sicherheitsprüfungen
- Zusammenhänge wie Nebenwirkungen und Dosierung von Medikamenten
Zwischen der Healthcare Natural Language API und AutoML Entity Extraction for Healthcare wählen
Die Healthcare Natural Language API bietet vortrainierte Natural Language-Modelle, um medizinische Konzepte und Zusammenhänge aus medizinischen Texten zu extrahieren. Die Healthcare Natural Language API ordnet Text verschiedenen vordefinierten medizinischen Wissenskategorien zu.
Mit AutoML Entity Extraction for Healthcare können Sie ein benutzerdefiniertes Entitätsextraktionsmodell erstellen, das mit Ihrem eigenen mit Anmerkungen versehenen medizinischen Text und Ihren eigenen Kategorien trainiert wurde. Weitere Informationen finden Sie in der AutoML Entity Extraction for Healthcare-Dokumentation.
Verfügbare Standorte
Die Healthcare Natural Language API ist in den folgenden Ländern verfügbar:
Standortname | Standortbeschreibung |
---|---|
asia-south1 |
Mumbai, Indien |
australia-southeast1 |
Sydney, Australien |
europe-west2 |
London, Großbritannien |
europe-west4 |
Niederlande |
northamerica-northeast1 |
Montreal, Kanada |
us-central1 |
Iowa, USA |
Merkmale der Healthcare Natural Language API
Die Healthcare Natural Language API untersucht medizinische Texte auf medizinische Konzepte und Beziehungen. Sie führen eine Entitätsanalyse mit der Methode analyzeEntities
durch.
Entitätsanalyseanfragen
Die Healthcare Natural Language API ist eine REST API und besteht aus JSON-Anfragen und -Antworten. In den folgenden Abschnitten wird gezeigt, wie Sie aus einem bestimmten medizinischen Text verschiedene medizinische Erkenntnisse extrahieren können:
- Entitäten, Beziehungen und Kontextattribute extrahieren
- Lizenziertes Vokabular verwenden
- Ausgabe als FHIR R4-Bundle extrahieren
Die Anfrage zur Entitätsanalyse enthält die folgenden Felder:
documentContent
: Die Daten für die Anfrage, die aus medizinischem Text bestehen. Der medizinische Text darf maximal 20.000 Unicode-Zeichen enthalten.licensedVocabularies[]
: Optional. Das SNOMED CT-Vokabular. Nur für Nutzer in den USA verfügbar.alternativeOutputFormat
: Optional. Das FHIR-Bundle-Format.
Antwortfelder der Entitätsanalyse
Die Entitätsanalyse gibt eine Reihe erkannter Erwähnungen medizinischer Kenntnisse, medizinischer Konzepte und Beziehungen zwischen Erwähnungen medizinischer Kenntnisse zurück. Dazu gehören:
entityMentions
: Vorkommen von Entitäten des medizinischen Wissens im Quelltext des medizinischen Textes. Jede Entitätserwähnung hat die folgenden Felder:mentionId
: Eine eindeutige Kennung für eine Entitätserwähnung in der Antwort.type
: die Kategorie des medizinischen Wissens der Entität.text
: Besteht aus dem FeldtextContent
und beschreibt den Auszug des medizinischen Textes, der die Entitätserwähnung enthält, undoffset
, die Position der Entität im medizinischen Quelltext.temporalAssessment
: gibt an, wie die verknüpfte Entität mit der Entitätserwähnung verknüpft ist. EntwederCURRENT
,CLINICAL_HISTORY
,FAMILY_HISTORY
,UPCOMING
oderOTHER
.certaintyAssessment
: Negation oder Qualifizierung des medizinischen Konzepts, entwederLIKELY
,SOMEWHAT_LIKELY
,UNCERTAIN
,SOMEWHAT_UNLIKELY
,UNLIKELY
oderCONDITIONAL
.subject
: gibt das Thema an, auf das sich das medizinische Konzept bezieht, entwederPATIENT
,FAMILY_MEMBER
oderOTHER
.linkedEntities
: eine Liste medizinischer Konzepte, die mit dieser Entitätserwähnung zusammenhängen könnten. Verknüpfte Entitäten geben dieentityId
an, die ein medizinisches Konzept mit einer Entität inentities
verknüpft.
entities
: Beschreibt die medizinischen Konzepte in den Feldern für verknüpfte Entitäten. Jede Entität wird mithilfe der folgenden Felder beschrieben:entityId
: Eine eindeutige Kennung aus dem FeldlinkedEntities
.preferredTerm
: ein bevorzugter Begriff für das medizinische Konzept.vocabularyCodes
: die Darstellung des medizinischen Konzepts in unterstützten medizinischen Vokabularen.
relationships
: Definiert direkte Beziehungen zwischen Entitätserwähnungen. Im Beispiel ist das Subjekt der Beziehung „Insulinregelung menschlich“ und das Objekt der Beziehung „5 Einheiten“.confidence
: gibt die Konfidenz des Modells in die Beziehung als Zahl zwischen 0 und 1 an.
Neben den aufgeführten Feldern kann die Antwort auch das Feld additionalInfo
enthalten, in dem zusätzliche Beschreibungen zum Typ der Entitätserwähnung enthalten sind.
Siehe Weitere Informationen.
Unterstützte Sprachen
Die Healthcare Natural Language API unterstützt ausschließlich das Extrahieren von Gesundheitsdaten aus englischem Text.
Unterstütztes medizinisches Vokabular
Die Healthcare Natural Language API unterstützt das folgende medizinische Vokabular:
- Foundational Model of Anatomy
- Gene Ontology
- HUGO Gene Nomenclature Committee
- Human Phenotype Ontology
- ICD-10 Procedure Coding System
- ICD 10-CM
- ICD-9-CM
- LOINC
- MeSH
- MedlinePlus-Gesundheitsthemen
- Metathesaurus Names
- NCBI Taxonomy
- NCI Thesaurus
- National Drug File
- Online Mendelian Inheritance in Man
- RXNORM
- SNOMED CT (nur für Nutzer in den USA verfügbar)
Unterstützte medizinische Wissenskategorien
Die Healthcare Natural Language API weist dem Feld entityMentions.type
eine Kategorie für medizinisches Wissen zu.
Im Folgenden finden Sie eine Liste unterstützter Kategorien für medizinisches Wissen. Die Typen der Entitätserwähnung, die zur Gruppen „Oncology“, „Social Determinants of Health“ (SDOH) und „Geschützte Gesundheitsinformationen“ (Protected Health Information, PHI) gehören, sind nur in der Vorabversion verfügbar:
Gruppe | Medizinische Wissenskategorie | Beschreibung |
---|---|---|
Allgemein | ANATOMICAL_STRUCTURE
|
Ein komplexer Teil des menschlichen Körpers, z. B. Zellen, Organe und Systeme. |
BODY_FUNCTION
|
Eine Funktion, die vom menschlichen Körper ausgeführt wird. | |
BF_RESULT
|
Das Ergebnis einer Körperfunktion. | |
BODY_MEASUREMENT
|
Normale Messung des menschlichen Körpers, z. B. Vitalzeichen, die ohne komplexe Tests oder Eingriffe mit einfachen Instrumenten wie einem Thermometer oder Stethoskop ermittelt wird. | |
BM_RESULT
|
Das Ergebnis einer Körpermessung. | |
BM_UNIT
|
Die Einheit für Körpermaße. | |
BM_VALUE
|
Wert einer Körpermaße. | |
LABORATORY_DATA
|
Ergebnisse von Körperprobentests. | |
LAB_RESULT
|
Eine qualitative Beschreibung von Labordaten wie „erhöht“, „verringert“, „positiv“ oder „negativ“. | |
LAB_VALUE
|
Der Wert einer Instanz der Labordaten. | |
LAB_UNIT
|
Die Maßeinheit für den Laborwert. | |
MEDICAL_DEVICE
|
Ein physisches oder virtuelles Instrument. | |
MEDICINE
|
Ein Medikament oder ein anderes Präparat zur Behandlung oder Prävention einer Krankheit. | |
MED_DOSE
|
Eine Dosis eines Medikaments. | |
MED_DURATION
|
Der Zeitraum, in dem ein Medikament verabreicht wurde. | |
MED_FORM
|
Die physischen Eigenschaften eines bestimmten Medikaments. | |
MED_FREQUENCY
|
Die Häufigkeit, mit der ein Medikament eingenommen wird. | |
MED_ROUTE
|
Eine Stelle im Körper, an der ein Medikament verabreicht wird. | |
MED_STATUS
|
Der Status eines vorhandenen Medikaments, z. B. „Weiter“, „Starten“, „Neu starten“, „Stopp“, „Wechseln“, „Erhöhen“ und „Verringern“. | |
MED_STRENGTH
|
Die Menge des Wirkstoffs in einer Dosis eines Medikaments. | |
MED_UNIT
|
Die Maßeinheit für den Wirkstoff in einem Medikament. | |
MED_TOTALDOSE
|
Die Menge der Medikamente, die auf einmal eingenommen werden sollen. | |
PROBLEM
|
Eine Erkrankung, einschließlich Befunden und Krankheiten. | |
PROCEDURE
|
Ein Diagnose- oder Behandlungsverfahren. | |
PROCEDURE_RESULT
|
Die Ergebnisse eines Verfahrens. | |
PROC_METHOD
|
Die zur Durchführung eines Verfahrens verwendete Methode. | |
SEVERITY
|
Der Schweregrad der Erkrankung. | |
SUBSTANCE_ABUSE
|
Beschreibung des Missbrauchs einer psychoaktiven Substanz. | |
Onkologie (Vorabversion) | CLINICAL_STATUS
|
Der Status eines Krebses, z. B. „aktiv“, „wiederkehrend“, „schüben“ und „beseitigt“. |
DATE
|
Eine Anmerkung mit einem Datum, z. B. das Diagnosedatum, das Eingriffsdatum oder das Datum einer Strahlenbehandlung. Sie extrahiert alle Elemente eines Datums und enthält möglicherweise nicht das Jahr. | |
DIMENSIONS
|
Die Maße eines Tumors, einer Masse oder eines anomalen Wachstums. | |
GENE_STUDIED
|
Untersuchte Gene, die direkt oder indirekt zur Tumorbildung führen, wie BRCA1, p53 und ALK. | |
HISTOLOGICAL_GRADE
|
Ein Klassifizierungssystem zur Einstufung des Erscheinungsbilds einer Krebszelle. | |
LAB_SPECIMEN
|
Biologisches Material, das für Tests oder Probennahme vom Körper gesammelt wird. | |
RADIATION_DOSAGE
|
Die Strahlungsmenge, die einem Patienten ausgeübt wird. | |
ONSET
|
Eine Datumsanmerkung für das Datum, an dem ein Patient zum ersten Mal krebsbezogene Probleme beobachtet hat. | |
VARIATION_CODE
|
Ein Code für die spezifische genomische Variante, der unter einem großen Codierungssystem wie ClinVar und HGVS erkannt wird. | |
Social Determinants of Health (SDoH) (Vorabversion) | AGE
|
Eine Alterskennung. Es enthält Wortgruppen zur Beschreibung des Alters wie „sieht jünger als angegeben aus“, „mittlerem Alter“, „78 Jahre“ oder „Teenager“.
Hinweis: HIPAA stuft Personen nur dann als PHI ein, wenn sie über 90 Jahre alt sind. Weitere Informationen finden Sie in der Zusammenfassung der HIPAA-Datenschutzregel. |
FAMILY
|
Wortgruppen, die die Familienstruktur oder Verwandte des Patienten beschreiben, z. B. „verheiratet mit zwei Kindern“, „Bruder“, „Ehefrau“, „unterstützende Eltern“ oder „geschieden“. | |
LIVING_SITUATION
|
Wortgruppen, die die Lebenssituation des Patienten beschreiben, z. B. „bei Mitbewohnern“, „hat rund um die Uhr häusliche Krankenpfleger“ oder „vor Kurzem umgezogen“. | |
SOCIAL_IDENTITY
|
Wortgruppen, die die soziale Identität des Patienten oder der Familie beschreiben, einschließlich ethnischer Zugehörigkeit, sexueller Orientierung, Religion, Nationalität, gesprochener oder nicht gesprochener Sprache oder Herkunftsland. | |
PHYSICAL_APPEARANCE
|
Wortgruppen, die das auffälligste oder deutlichste körperliche Merkmal des Patienten oder der Familie beschreiben, wie „Narbe auf der rechten Wange“, „Down-Syndrom“, „fettleibig“ oder „amputiertes linkes Bein“. | |
OCCUPATION
|
Wortgruppen, die den Beruf und den Beschäftigungsstatus des Patienten oder der Familie beschreiben, z. B. „Mutter im Ruhestand“, „arbeitete 20 Jahre lang als Schweißer“ oder „im letzten Jahr verloren gegangen“. | |
Geschützte Gesundheitsdaten (Protected Health Information, PHI) (Vorabversion) | PERSON_NAME
|
Eine generische Namenskennung für eine Person. Dazu gehören Titel wie „Dr.“, „Frau“ oder „MD“ |
ORGANIZATION_NAME
|
Eine Kennung für eine medizinische Organisation, die PHI erfasst, z. B. eine Klinik, ein Pflegeheim oder ein Krankenhaus. | |
GENERIC_ID
|
Eine generische ID zur Identifizierung von Krankenakten, Patienten, Ärzten und Krankenhäusern, z. B. die SSN des Patienten oder die Nummer eines Dienstleisters. | |
LOCATION
|
Ein geografischer Standort, der Namen und Zahlen für Gebäude, Straßen, Städte, Bundesländer oder Postleitzahlen enthalten kann. | |
PHONE_NUMBER
|
Eine Nummer zur Angabe einer Telefonnummer, Faxnummer oder Pagernummer. | |
EMAIL_ADDRESS
|
Die Kennung einer E-Mail-Adresse. | |
URL
|
Die Adresse einer Website. | |
ZIPCODE
|
Eine Postleitzahl-ID. |
Unterstützte funktionale Funktionskategorien
Die Healthcare Natural Language API kann funktionale Funktionen oder Attribute einer Entität aus Kontext ableiten. In der Anweisung "Kusumas Mutter hat Diabetes" hat die Bedingung "Diabetes" beispielsweise die funktionale Funktion subject
FAMILY_MEMBER
.
Temporäre Beziehungen
Temporäre Beziehungen, die im Feld temporalAssessment
zurückgegeben werden, beschreiben, wie diese erwähnte Entität zum Subjekt temporär in Beziehung steht.
Die Healthcare Natural Language API unterstützt die folgenden temporären Beziehungen:
CURRENT
CLINICAL_HISTORY
FAMILY_HISTORY
UPCOMING
OTHER
Betreffzeilen
Betreffzeilen, die im Feld subject
zurückgegeben werden, beschreiben die Person, auf die sich die Entität bezieht.
Die Healthcare Natural Language API unterstützt die folgenden Subjekte:
PATIENT
FAMILY_MEMBER
OTHER
Wahrscheinlichkeitsbewertungen
Wahrscheinlichkeitsbewertungen, die im Feld certaintyAssessment
zurückgegeben werden, beschreiben die Vertrauenswürdigkeit des Erstellers der Originalnotiz. Wenn die Originalnotiz beispielsweise "Der Patienten hat Halsschmerzen" enthält, gibt die Bewertung einen LIKELY
-Wert zurück, der angibt, dass der Notizenersteller es für wahrscheinlich hält, dass der Patient Halsschmerzen hatte. Wenn die Originalnotiz "Der Patienten hat keine Halsschmerzen" enthält, gibt die Bewertung einen UNLIKELY
-Wert zurück, der angibt, dass der Notizenersteller es für unwahrscheinlich hält, dass der Patient Halsschmerzen hatte.
Wahrscheinlichkeitsbewertungen können folgende Werte sein:
LIKELY
SOMEWHAT_LIKELY
UNCERTAIN
SOMEWHAT_UNLIKELY
UNLIKELY
CONDITIONAL
Weitere Informationen
Das Feld additionalInfo
enthält zusätzliche Details zu einer Entitätserwähnung. Das Feld additionalInfo
für eine DATE
-Entitätserwähnung kann beispielsweise Details zum Typ des Datums enthalten, die wie folgt kategorisiert werden:
ADMISSION_DATE
CONSULTATION_DATE
DISCHARGE_DATE
SERVICE_DATE
VISIT_DATE
DIAGNOSIS_DATE
MED_STARTED_DATE
MED_ENDED_DATE
NOTE_DATE
PROCEDURE_DATE
RADIATION_STARTED_DATE
RADIATION_ENDED_DATE
STAGE_DATE
Unterstützte Beziehungen zwischen Entitätserwähnungen
Die Healthcare Natural Language API kann Beziehungen zwischen Entitätserwähnungen basierend auf dem umgebenden medizinischen Text ableiten. In der Antwort wird das Subjekt der Beziehung durch subjectId
und das Objekt der Beziehung durch objectId
angegeben.
Die Healthcare Natural Language API unterstützt die folgenden Beziehungen zwischen Entitätserwähnungen:
Betreff | Objekt |
---|---|
ANATOMICAL_STRUCTURE |
MEDICAL_DEVICE |
BODY_FUNCTION |
BF_RESULT |
BODY_MEASUREMENT |
BM_RESULT |
BODY_MEASUREMENT |
BM_UNIT |
BODY_MEASUREMENT |
BM_VALUE |
LABORATORY_DATA |
LAB_RESULT |
LABORATORY_DATA |
LAB_UNIT |
LABORATORY_DATA |
LAB_VALUE |
MEDICINE |
MED_DOSE |
MEDICINE |
MED_DURATION |
MEDICINE |
MED_FORM |
MEDICINE |
MED_FREQUENCY |
MEDICINE |
MED_ROUTE |
MEDICINE |
MED_STATUS |
MEDICINE |
MED_STRENGTH |
MEDICINE |
MED_TOTALDOSE |
MEDICINE |
MED_UNIT |
PROBLEM |
ANATOMICAL_STRUCTURE |
PROBLEM |
MEDICINE |
PROBLEM |
PROCEDURE |
PROBLEM |
SEVERITY |
PROCEDURE |
ANATOMICAL_STRUCTURE |
PROCEDURE |
PROC_METHOD |
PROCEDURE |
PROCEDURE_RESULT |
SUBSTANCE_ABUSE |
SEVERITY |
Healthcare Natural Language API-Ausgabe als FHIR-Bundle
Wenn Sie die Methode analyzeEntities
anfordern und das Feld alternativeOutputFormat
auf FHIR_BUNDLE
festgelegt ist, enthält die Antwort die folgenden JSON-Objekte:
- Die Entitätserwähnung, die Entitäten und die Beziehungen
- Ein als String dargestelltes FHIR-R4-Bundle, das alle Entitäten, die Entitätserwähnungen und die Beziehungen im JSON-Format enthält
Zum Erstellen des FHIR R4-Bundles ordnet die Healthcare Natural Language API die Entitätserwähnungen, Entitäten und Beziehungen FHIR-Ressourcen und ihren Elementen zu. In der folgenden Tabelle sind einige dieser Zuordnungen aufgeführt.
Healthcare Natural Language API-Entitätserwähnungen | Kategorie medizinisches Wissen | FHIR R4-Ressourcen und -Elemente |
---|---|---|
PROBLEM |
Condition |
|
PROBLEM |
Condition.category |
|
PROBLEM |
Condition.status |
|
PROBLEM |
ANATOMICAL_STRUCTURE |
Condition.bodySite |
PROBLEM |
ANATOMICAL_STRUCTURE |
Condition.evidence |
PROBLEM |
SEVERITY |
Condition.severity |
PROCEDURE |
Procedure |
|
PROCEDURE |
Procedure.status |
|
PROCEDURE |
Procedure.code |
|
PROCEDURE |
ANATOMICAL_STRUCTURE |
Procedure.bodySite |
PROCEDURE |
MEDICAL_DEVICE |
Procedure.usedCode |
PROCEDURE |
PROBLEM |
Procedure.reasonReference |
MEDICINE |
MedicationStatement |
|
MEDICINE |
MedicationStatement.status |
|
MEDICINE |
MedicationStatement.medication |
|
MEDICINE |
PROBLEM |
MedicationStatement.reasonReference |
MEDICINE |
MED_DOSE |
MedicationStatement.dosage.doseAndRate.doseQuantity |
MEDICINE |
MED_FREQUENCY |
MedicationStatement.dosage.text |
MEDICINE |
MED_ROUTE |
MedicationStatement.dosage.route |
MEDICINE |
MED_STRENGTH |
MedicationStatement.dosage.doseAndRate.doseQuantity |
MEDICINE |
MED_UNIT |
MedicationStatement.dosage.doseAndRate.doseQuantity |
Informationen zum Extrahieren von Entitäten aus Text als FHIR R4-Bundle finden Sie unter Ausgabe als FHIR R4-Bundle extrahieren.