BiolFlor Planung

Aus Offene Naturführer BiolFlor
Wechseln zu: Navigation, Suche

Die Daten wurden bereits 2009/2010 auf der Basis einer Genehmigung der Autoren die öffentlich zugänglichen Daten nutzen zu dürfen in eine Access-Datenbank überführt und restrukturiert. Die Originalstrukur der Oracle-Datenbank am UFZ lag und liegt nicht vor; die Daten wurden anhand der Renderingstruktur neu zugeordnet. Hier evtl. erwähnte Feldnamen können daher nicht direkt mit Feldnamen am UFZ korreliert werden (die im Folgenden verwendeten IDs sind ebenfalls nur intern zur Berarbeitung). Aufgrund der Erstellung fehlen die nicht publizierten Informationen aus BiolFlor und in einigen Fällen sind Beziehungen, die in der Anzeige nur durch die Abfolge von Informationen kenntlich sind, noch nicht in den Daten aufbereitet.

Da BiolFlor weitgehend auf der Systematik der Wißkirchen-Liste von 1998 beruht, wurde mit der Weiterverarbeitung abgewartet, bis die überarbeitete Kartierungssystematik des Bundesatlas und der neuen Roten Liste zur Verfügung stand. Eine Weiterverarbeitung geschah im Rahmen des ViBRANT Projektes als Pilot für die Verwendung des Semantic Media Wiki in biologischer Wissensverwaltung.

Status 2012:

Die Daten liegen in der Hierarchie:

  • Taxon
  • Merkmalsgruppe (Group)
  • Merkmalsüberschrift (Heading)
  • Merkmal/Eigenschaft (Char)

vor, den Merkmalen sind Werte zugeordnet die vorläufig als Literal, StateRef und LitRef in drei Feldern gespeichert sind. Von den drei Wertefeldern ist jeweils maximal nur eines gefüllt (keine Überschneidungen). Wenn CharID fehlt (d.h. bei Group/Heading Zeilen), ist nie ein Wert vorhanden.

Aber: Alle drei Wertetypen (insbes. auch Ref) können mit einem Modifier oder Annotation ergänzt sein. Bei Reference kann in einigen Fällen auch eine Annotation OHNE Literaturverweis auftreten (z.B. persönliche Beobachtungen).

Ein Heading ("Spezielle Literaturverweise") war noch nicht eindeutig und kam in zwei Gruppen vor, jetzt eindeutig gemacht (Literaturnachweise zur Morphologie, Literaturnachweise zu Samenmerkmalen).

9 Merkmale kamen in verschiedener Bedeutung in je mehreren Gruppen vor, diese ebenfalls durch neue eindeutige Merkmale ersetzt:

  • Char 248: Measured Object (einzige Werte: 481: Diaspore, 482: Germinule) und Char 204: Diasporen- bzw. Germinulentyp (Werte: seed, mericarp, fruit, etc.) kommen in Heading 39: Weights und 40: Sizes vor. Die Situation ist ähnlich wie zuvor. Es wurde zunächst erwogen, die Information als Qualifier zu speichern, dies hätte jedoch 248, 204, und 242 abdecken müssen.
  • Ähnlich Char 242 Heteromorphic type und Char 249 Constraint kommen in Heading 38: Germinule Type, 39: Weights und 40: Sizes vor. Dies sind keine Merkmale des Taxon, sondern sie beschreiben hier jeweils das gemessene Unterobject (z.B. Frucht als Diaspore, Frucht als Germinule). Die folgenden Merkmale Frucht-Größe, Frucht-Gewicht, etc. beziehen sich also nicht auf das Taxon, sondern auf eine Frucht mit diesen Eigenschaften. Diese Strukturierung wurde aus Zeitgründen nicht weiter aufgelöst. Ähnlich wie oben, Qualifier möglich, aber komplex.

In beiden Fällen wurden die Merkmale nach Heading getrennt (Heading 38: TermID 242 -> 242 (re-used); 39: TermID 242 -> 290, 249 -> 292; Heading 40: 242 -> 291, 249 -> 293,bzw. Heading 39: Weights: 204 -> 295 (Type of germinule or diaspore (when in weight)), 248 -> 297 (Measured object (when in weight)); Heading 40: Sizes: 204 -> 296 (Type of germinule or diaspore (when in size)), 248 -> 298 (Measured object (when in size))) um spätere Arbeiten zu vereinfachen (alle Merkmale sollen genau ein Parent-Heading haben); das Problem an sich ist damit aber noch nicht gelöst.

  • Pseudo-"Char" 231 Qualifier erscheint in vielen Heading, zu Modifier/Qualifier an den vorhergehenden echten Char angefügt. Qualifier erschien nach folgenden Merkmalen:
188 Lebensform
189 Lebensdauer
193 Rosettentypen
190 Vegetative Fortpflanzung
213 Metamorphosen der Wurzel
191 Speicherorgane
192 Metamorphosen der Sproßachse
218 Ernährungsweise
215 Kletterverhalten
Alle diese Merkmale wurden geprüft ob mehrmals unmittelbar aufeinander folgend vorkommend; dies war nicht der Fall. Char 231 wurde anschließend gelöscht.
  • Pseudo-"Char" 238 Abundance erscheint in Heading 28 Dicliny und 31 Pollen vector. An Char 200 Pollen vector und 197 Dicliny als modifier angehängt (es wurde geprüft, dass nie zwei 200 oder zwei 197 nacheinander kamen, sonst wäre der Modifier an beide Datensätze angehängt worden. Char 238 wurde anschließend gelöscht.
  • Char 239 Systematic reference erscheint in Heading 29 Self-sterility and self-incompatibility und 31 Pollen vector. Werte sind keine Literatur, sondern "species", "genus", "family" etc. Im Deutschen ist das Feld zutreffender "Datenbezug" genannt (beide wären vielleicht klarer als "Reference refers to (tax. rank)"/"Literatur bezieht sich auf (tax. Rang)" benannt?). Hier aber zu einem Qualifier/Modifier des Literaturzitats geändert. Char 239 wurde anschließend gelöscht.
  • Char 262 Status erscheint in Heading 45 Floristic Zone, 47 Oceanity, 48 Floristic Region. Die Werte sind in allen drei Fällen die gleichen, und es handelt sich evtl. eher um einen Qualifier. Da bei Florenzone aber bereits zwei verbundene Merkmale verwendet sind, wurde es vorläufig so belassen und lediglich in drei Merkmale geteilt (jedes Merkmal eindeutig einem Heading zugeordnet). Heading 45: 262->300: Status (Florenzone), 47: 262->301: Status (Ozenanität), 48: 262->302: Status (Florengebiet)
  • DAMIT verbleibt als einziger uneindeutiger Character die 225, Reference/Literatur. Diese Situation ist schwer zu ändern, da nicht völlig klar ist auf welchen Bereich sich die Literaturangabe bezieht (ein Merkmale, mehrere, alle im Heading?)

Sonstiges:

Das Heading: 51 Anzahl der Hemerobiestufen wurde mit "Hemerobie" vereinigt und gelöscht. In Fällen in denen merkmalsgruppe und Merkmalsüberschrift identisch sind, soll das Heading unterdrückt werden.

Unter References waren einige unechte References, die eher Kommentare waren. Diese wurden als Annotation (Freitext) Feld übernommen (Merkmal dabei stets 225: reference.

Diskussion: Die Merkmalsgruppen und enthaltene Headings und Char:

  • Merkmalsgruppe: Chromosomenzahlen und Ploidie-Stufen
  • Merkmalsgruppe: DNA-Gehalte
  • Merkmalsgruppe: Phylogenie

sollten evtl. für die ON ignoriert werden.

Fertiggestellt:

1. Import der Literatur, die anschließend über das Kurzzitat verknüpft werden wird. Literatur in erster Version so ähnlich wie möglich dem BiolFlor Originalzitat; zweite Version dann in Felder aufgetrennt, in einigen Fällen konnten bei BiolFlor noch fehlende Angaben (Quelle, Seitenzahlen, Schreibung einiger Autoren ergänzt werden. Durch Vergleich mit der ersten Version ist stets ersichtlich was die Originalzitate bei BiolFlor, und was Ergänzungen sind.


Arbeiten die gemacht werden müssten um ein eindeutiges Format zu erhalten:

  1. Daten klarer strukturieren, wiederholte Messungen an verschiedenen Subobjekten (Samengewicht, Größe) umstrukturieren.
  2. Literatur den Daten klar zuordnen, nicht als "Pseudo-Merkmal" welches nur durch Reihenfolge einen Bezug hat. Hinweis: In der BiolFlor Originaldatenbank sind diese Zuordnungen höchstwahrscheinlich enthalten, die mangelnde Struktur beruht nur auf der Schwierigkeit diese durch die verfügbar gemachten Daten nachzuvollziehen.