abstract graphic of two people

Das Folgende ist ein Auszug aus Accessing and Analysing Relevant Content in Today’s Information Chaos. 

Semantische Anreicherung ist die Zutat, um relevante Suchergebnisse zu erhalten, auch wenn sie nicht dieselbe Terminologie wie die Suchanfrage verwenden. Beispielsweise würde eine Abfrage nach „Zulassung von Arzneimitteln für seltene Krankheiten“ Ergebnisse für den Orphan Drug Act der FDA enthalten. Google erkennt an, dass sich „Arzneimittelzulassung“ auf „staatliche Vorschriften“ bezieht. Es weiß auch, dass „Arzneimittel für seltene Leiden“ und „seltene Krankheit“ miteinander in Verbindung gebracht werden, obwohl unterschiedliche Begriffe verwendet werden. 

Vergleichen Sie dies mit einem anderen Szenario. Sie wurden gebeten, eine wichtige Information zu finden, die Sie per E-Mail erhalten haben. Sie durchsuchen alle Ihre E-Mails, können sich aber nicht an den genauen Wortlaut oder Satz in der Betreffzeile erinnern. Es ist unwahrscheinlich, dass die textbasierte Suchfunktion der E-Mail das richtige Ergebnis zurückgibt, wenn Sie nicht das genaue Wort verwenden, was unweigerlich zu mehreren Suchvorgängen und Zeitverlust beim Durchsuchen von E-Mails führt. 

Die großen Unterschiede in den Algorithmen zwischen unseren beiden Beispielen – Google und einer einfachen E-Mail-Suche – zeigen die Macht und den Nutzen der semantischen Anreicherung in unserem täglichen Leben. Wir verlassen uns zunehmend auf Suchwerkzeuge, um automatisch geeignete Synonyme einzuschließen. 

Erfahren Sie mehr in dem nachfolgenden Blogbeitrag, der zuerst im Blog des CCC erschien. 

 

Where it comes into play 

To eliminate the noise and provide relevant search results, information solutions must go beyond simple keyword matching and to use search engines and algorithms that link concepts, topics, and associations to form a deeper understanding of a user’s intent. 

For instance, a researcher in pharmacovigilance may need to identify and list all potential Injection Site Reactions (ISRs) before an upcoming clinical trial. Searching published materials might identify traditional symptoms such as sore arm, redness, and inflammation. However, without integrating the company’s Adverse Event or Safety database, the search results could miss other unknown reactions such as itching, eczema, and hives. 

To tap into external and internal data sources, it becomes necessary to use biomedical vocabularies and ontologies (e.g., NIH’s MeSH [MeSH Browser, n.d.]) which are semantically enriched and indexed. The result would be that a search for “Injection Site Reactions” could produce results from known ISRs that had been published previously and catalogued and could also draw from adverse events gleaned through internal sources. A comprehensive solution would account for a company’s particular ontology as well as the various vocabularies specific to different organizations within the company. 

Challenges and opportunities 

While Google continues to evolve its search algorithms, biomedical research has its own set of challenges as noted in the article “Dug: A Semantic Search Engine Leveraging Peer-Reviewed Knowledge to Span Biomedical Data Repositories” by Waldrop et al: “Despite the practical utility of Google’s proprietary knowledge graph for general search, the provenance, depth, and quality of its biomedically relevant connections are not easily verifiable. There remains a need for a search tool capable of leveraging evidence-based biological connections to show researchers datasets useful for hypothesis generation or scientific support.” 

This is where functionality beyond linking key terms evolves into topic-linking (or topic co-occurrence). Like Dug, scientific communities and commercial entities are collaborating to improve semantic search. Continuing to build dictionaries and structures to organize, link, and catalog scientific data will require standardization and sustained commitment. 

Life science companies should look to software solutions that embed semantic enrichment to find relevant scientific concepts faster and to accelerate new discoveries. 

Keep reading Accessing and Analyzing Relevant Content in Today’s Information Chaos.  

Learn more about finding relevant content across data sources with semantic search in RightFind Navigate. 

Author: RD

RightsDirect, eine Tochtergesellschaft von Copyright Clearance Center, bietet fortschrittliche Informations- und Datenintegrationslösungen für Organisationen in ganz Europa und Asien. Als Pionier der freiwilligen kollektiven Lizenzierung ist CCC ein führender Anbieter von Informationslösungen für Organisationen auf der ganzen Welt. Mit umfassender Fachkompetenz in den Bereichen Urheberrecht, Technologie, Fachinhalte, PIDs, FAIR-Datenprinzipien, Metadaten und mehr arbeitet CCC daran Urheberrechte zu stärken, den Austausch von Wissen zu beschleunigen und Innovationen voranzutreiben. CCC und seine Tochtergesellschaft RightsDirect unterstützen Unternehmen dabei, die Leistungsfähigkeit von Daten, KI und maschinellem Lernen zu nutzen, um strategische Entscheidungen zu treffen, ihr Geschäft auszubauen und Wettbewerbsvorteile zu erlangen.