Methods Inf Med 1975; 14(04): 208-212
DOI: 10.1055/s-0038-1635713
Original Article
Schattauer GmbH

Das Problem der formalen Wiedererkennung von Informationseinheiten bei der wissenschaftlichen Informationsverarbeitung[*)]

The Problem of Formal Identification of Information Units in Scientific Information Processing
W. Gerdel
1   Aus dem Institut für Dokumentation und Information über Sozialmedizin und öffentliches Gesundheits-wesen, Bielefeld. Leiter: Prof. Dr. med. O. Nacke
› Author Affiliations
Further Information

Publication History

Publication Date:
16 February 2018 (online)

Mit den Problemen der automatischen Wiedererkennung von Personendaten hat sich die medizinische Befund- und Diagnosendokumentation beschäftigt. Hier geht es um ein Verfahren zur Wiedererkennimg von Literaturinformationen an Hand verschlüsselter Teile der bibliographischen Angaben. Seine theoretischen Grundlagen werden erörtert : Kriterien zur Auswahl von Merlanalen für die Identifikation(möglichst eindeutige Erhebbarkeit, möglichst große Trennfähigkeit), Ableitung des Begriffes der Erkemnuigswahrscheinlichkeit (die Wahrscheinlichkeit, bei der sukzessiven zufälligen Zuordnung von Elementen zu einer viel größeren Anzahl von Klassen eine bisher unbesetzte Klasse anzutreffen) und quantitative Behandlung von Größen, die che Erkemiungswahrscheinlichkeit beeinflussen (Abhängigkeitoder Unabhängigkeit der zur Wiedererkennung herangezogenen Merkmale, Gleichverteilung oder Ungleichverteilung der Merlanalsausprägungen). Für einen Anwendungsfall wird die Leistungsfähigkeitdes beschriebenen Verfahrens mit Hilfe der entwickelten Formel für die Erkennungswahrscheinlichkeit berechnet. Die Vorhersage stimmt gut mit dem empirischen Ergebnis überein.

Medical record documentation has concerned itself with the problems of automatic identification of personal data. This paper deals with a system for the identification of literature information by coded elements of bibliographic data.

The theoretical basis of the system is to be discussed: criteria for the selection of identification characteristics (to be determined as definitely as possible and with the greatest possible selectivity) ; deducing the concept of the probability of identification (the probability of finding a vacant class during gradual random assignment of elements to a much larger number of classes), and the management of factors affecting the probability of identification (dependence or independence of identification characteristics, way of distribution of test data). In one case, the efficiency of the system is tested with the given formula for the probability of identification. The prediction tallies with the empirical results.

* Vortrag auf dom 21. Biometrischen Kolloquium der Deutschen Region der Internationa1en Biometrischen Gesellschaft, Stuttgart-Hohenheim, 5.—7. März 1975. Herrn Prof. Dr. med. 0. Nacke zum 60. Geburtstag gewldmet.


 
  • Literaturverzeichnis

  • 1 Jaglom A. M, Jaglom I. M. Wahrscheinlichkeit mid Information.. VEB Deutscher Verlag der Wissensehaften; Berlin: 1960
  • 2 Rènyt A. Wahrscheinlichkeitsrechnung mit einem Anhang über Informationstheorie.. VEB Deutscher Verlag der Wissensehaften; Berlin: 1966
  • 3 Wagner G. Medical Record Linkage. Fritze E, Wagner G. Dokumentation des Krankheitsverlaufs, Probleme der Erfassung des zeitlichen Krankheitsablaufes. Ber. 13. Jahrestagg. der Dtsch. Ges. Med. Dok. u. Statist, in der DGD e.V., 30. Sept.—2. Okt. 1968 in Bochum.. Schattauer; Stuttgart: 1969
  • 4 Wagner G, Stutzer G. Über die Selektivität der sog. I-Zahl im o Allgemcinen Krankenblattkopf« und die Brauchbarkeit ihrer einzelnen Komponenten. Meth. Inform. Med 2 1963; 148-155.