To acquaint myself with the Biological Collections Ontology I went through<br>
it and made some notes. John Wieczorek suggested I share these notes so<br>
that they can be responded to openly. They are as follows, I look forward<br>
to your comments.<br>
1. Why are the dates clustered together in one branch, but day, month,<br>
year separate?<br></blockquote><div><br></div><div>In what context are they clustered together? Is it simply a matter of alphabetical listing? In Darwin Core they are organized within the Event class except when they are dates for a distinct activity, such as georeferencedDate (<a href="http://rs.tdwg.org/dwc/terms/index.htm#locationindex" target="_blank">http://rs.tdwg.org/dwc/terms/index.htm#locationindex</a>).</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
2. eventDate: regarding date ranges. Sometimes an event continues for a<br>
period such as a field trip, but often a date range is required because<br>
although the event took place in a certain time frame, the exact event<br>
date is not known. There should perhaps be a way of distinguishing between<br>
these two situations.<br></blockquote><div><br></div><div>The definition of eventDate (<a href="http://rs.tdwg.org/dwc/terms/index.htm#eventDate" target="_blank">http://rs.tdwg.org/dwc/terms/index.htm#eventDate</a>) recommends the use of ISO 8601:2004(E), which is quite expressive and covers the cases you brought forth here. Have a look at the examples in the comment section of the term at the URL above.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
3. Vernacular name should be associated with a language and a geographic<br>
area where it is used?<br></blockquote><div><br></div><div>Agreed, and it does act thus in the context of a Vernacular Names extension (<a href="http://tools.gbif.org/dwca-validator/extension.do?id=http://rs.gbif.org/terms/1.0/VernacularName" target="_blank">http://tools.gbif.org/dwca-validator/extension.do?id=http://rs.gbif.org/terms/1.0/VernacularName</a>), which allows multiple vernacular names to be associated with a related Taxon.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
4. verbatimSRS, footprintSRS and geodeticDatum are similar but not the<br>
same. They seem to overlap. The SRS has a clear definition epsg-<br>
<a href="http://registry.org" target="_blank">registry.org</a>, but geodeticDatum is a more general term. The definitions<br>
and usages could be stronger.<br></blockquote><div><br></div><div>Do you have recommendations for improvement?</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
5. There is a need for local grid reference systems. Many countries have<br>
their own ways of writing grid references and verbatimLongitude and<br>
verbatimLatitude are not suitable for these. For example, the UK has grid<br>
references such as NZ28F, which mean something very specific in the<br>
country. It is a similar situation in Belgium and I imagine other<br>
countries.<br></blockquote><div><br></div><div>For these cases, the terms verbatimCoordinates is recommended, accompanied by a verbatimCoordinateSystem. </div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
6. georeferenceVerificationStatus &amp; identificationVerificationStatus: It<br>
is not clear how these should be used. The names are similar, but the<br>
described usage is very different. I find it hard to imagine how they<br>
would be used in practice.<br></blockquote><div><br></div><div>Both terms are meant to give a statement about the nature of the effort to verify that the subject (georeference or determination) are correct. Using the georeferenceVerificationStatus as an example, suppose a user of the data calls into question the coordinates or uncertainty for a location and informs the responsible party at the data source. Suppose that person spends an hour looking through all the details associated with the collecting event and determines that, in fact, the georeference is as good as it can be given remaining documentation. Having spent all of that energy, and given institutional memory at the scale of museum time, it is worth noting that the georeference has been confirmed to be as good as it can be by the curator at the time. The georeferenceVerificationStatus would be set to &quot;verified by curator&quot;, the georeferencedBy should be updated to include the curator&#39;s name, the georeferencedDate should be updated, and georeferenceRemarks should be added to capture the information that would avoid the same question arising in the future - all to save doing the same thing over and over. </div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
7. There are occasions within biogeographic databases where you want to<br>
indicate that an observation or collection is not trusted. I can’t see a<br>
place where a record can be verified as a whole. For example, if it is<br>
suspected that the label has been muddled up or the collector is suspected<br>
of fraud. With an observation there is no specimen to verify, but the<br>
record should be verifiable.<br></blockquote><div><br></div><div>That is true. Confidence is not covered in Darwin Core other than in specific contexts. One could go further and say who says what is wrong, when, and why. There are other contexts where annotations of great richness can be provided for (attached to) specific aspects of data. See, for reference, Filtered Push (<a href="http://wiki.filteredpush.org/wiki/" target="_blank">http://wiki.filteredpush.org/wiki/</a>).</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
8. member, lithostratigraphicTerms, bed etc etc. I don’t know anything<br>
about geology, but these terms seem to overlap and could perhaps be<br>
thought of as synonymous. It would be valuable to find records where these<br>
terms are required to see how they are used in practice.<br></blockquote><div><br></div><div>These terms arose from the Paleontology community long before (1 Jun 2005) Darwin Core became a ratified standard at the Workshop on Paleontology Collection Digitization in Springfield, Illinois - a workshop to define a Darwin Core Paleontology Extension (<a href="http://wiki.tdwg.org/twiki/bin/view/DarwinCore/PaleontologyElement" target="_blank">http://wiki.tdwg.org/twiki/bin/view/DarwinCore/PaleontologyElement</a>), which became subsumed in ratified Darwin Core (see <a href="http://rs.tdwg.org/dwc/terms/history/versions/index.htm#paleo" target="_blank">http://rs.tdwg.org/dwc/terms/history/versions/index.htm#paleo</a>). </div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
9. county &amp; stateProvince: These are parochial terms. There are many<br>
nested subdivisions of countries and there is probably a better way to<br>
describe them. Perhaps there is already a hierarchical ontology to<br>
describe geographic areas.<br></blockquote><div><br></div><div>Yes, these are legacy terms arising from the first implementation of Darwin Core in the Species Analyst network (see <a href="http://en.wikipedia.org/wiki/Biodiversity_informatics#History_of_the_discipline_of_Biodiversity_Informatics" target="_blank">http://en.wikipedia.org/wiki/Biodiversity_informatics#History_of_the_discipline_of_Biodiversity_Informatics</a>). In the ontology world, there is GAZ (<a href="http://www.ebi.ac.uk/ontology-lookup/browse.do?ontName=GAZ" target="_blank">http://www.ebi.ac.uk/ontology-lookup/browse.do?ontName=GAZ</a>). In a (technologically) flattened world we need slots to put things in, and geography is particularly recalcitrant in this respect, even when &quot;restricted&quot; to administrative boundaries (see appendix to this message).</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
10. Abundance estimates: There are several ways to describe estimates of<br>
abundance, such as DOMAIN, DAFOR, percent coverage, is there a way to<br>
accommodate these?<br></blockquote><div><br></div><div>There is as of 19 Mar 2015 with the advent of the sampling event terms (see <a href="http://rs.tdwg.org/dwc/terms/history/decisions/#Decision-2015-03-19_18">http://rs.tdwg.org/dwc/terms/history/decisions/#Decision-2015-03-19_18</a>). </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
11. Controlled vocabularies: Many terms suggest using a controlled<br>
vocabulary, but most don’t have one. Is this an area we should work on?<br></blockquote><div><br></div><div>This is an area best fit for specific domains, I think. Those who need them should work on them, definitely.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
12. Consider the importance of citation and providence the “according to”<br>
information seems rather weak. There should perhaps be a space for an<br>
identifier (ORCID). Also, biographic information such as date of birth,<br>
date of death, institutional association. These are useful for providence,<br>
but also for validation of records.<br></blockquote><div><br></div><div>Whereas I agree with the importance of sources, in Darwin Core terms are added when a demonstrated need to share information arises among at least two &quot;independent&quot; parties (i.e., not just for the purposes of a single project). To date no such need has been demonstrated.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
13. What is the difference between fieldNumber and recordNumber?<br></blockquote><div><br></div><div>These terms are used interchangeably in some contexts, but in Darwin Core they are distinct concepts. A recordNumber applies to an Occurrence of an organism at a place and time (such as a single bird specimen), while the field number applies to an Event that might correspond to a set of many organisms of distinct taxa from something like a trawl in the ocean. Both concepts are in common use.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
14. establishmentMeans: the description seems to conflate three concepts,<br>
the length a taxon has been established at a location (e.g. native); the<br>
way it got to the location (e.g. introduced) and the dispersive ability of<br>
the taxon (e.g. invasive). To my mind the latter is not required as it is<br>
an opinion about the taxon as a whole not the observation. The first two<br>
should be separated to make them useful. People need to distinguish<br>
between the native status of a species at a location and how it got to<br>
that location. Invasive species biologists are particularly interested in<br>
the vectors of introduction.<br></blockquote><div><br></div><div>Agreed. This term has been discussed on this list (<a href="http://lists.tdwg.org/pipermail/tdwg-content/2010-October/001650.html">http://lists.tdwg.org/pipermail/tdwg-content/2010-October/001650.html</a>), and has received criticism on multiple occasions elsewhere, but an overhaul has not before been proposed or championed.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
15. The health of an animal or plant can be noted on an observation and is<br>
useful for analysis. Is there some way of stating that the organism was<br>
dead when the specimen or observation was made?<br></blockquote><div><br></div><div>The term &quot;behavior&quot; seems like a stretch for this case, so I will suggest, &quot;No, there is not.&quot; :-)</div><div><br></div><div>Hope you (and others) find some of this useful.</div><div><br></div><div>Cheers,</div><div><br></div><div>John</div><div><br></div><div>(Don&#39;t forget the appendix below if you are a geography enthusiast.)</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Appendix:

A few current administrative level names, going at times up to six levels deep.