<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
<body bgcolor="#ffffff" text="#000000">
My apologies to John Wieczorek for the panicked tone of my previous
email to the list.&nbsp; It appeared to me (apparently incorrectly) that the
issue was
being closed without addressing the concern that I raised when I
initially brought this up in my post to the MRTG wiki
(<a class="moz-txt-link-freetext" href="http://www.keytonature.eu/wiki/MRTGv08_Type_term_inconsistent_with_DwC">http://www.keytonature.eu/wiki/MRTGv08_Type_term_inconsistent_with_DwC</a>).&nbsp;&nbsp;
I have the following general concerns about what is being proposed.&nbsp; I
will follow with a particular use-case comment in a separate email.&nbsp; <br>
<b>Hierarchy clarification needed.&nbsp;</b> If I am understanding the
proposal as John has summarized it there would be three terms that
could apply to a resource with metadata subject to DwC.&nbsp; A new DwC term
<i>recordClass</i> has with controlled values corresponding to the TDWG
classes: "Occurrence", "Event", "Location", "Taxon".&nbsp; <i>dcterms:type</i>
is another term which could theoretically have DCMI Type values of:
"Collection", "Dataset", "Event", "Image", "InteractiveResource",
"MovingImage", "PhysicalObject", "Service", "Software", "Sound",
"StillImage", or "Text" (although not all may be appropriate in the DwC
context).&nbsp;&nbsp; It is not clear to me in John's proposal whether the
assignment of <i>dcterms:type</i> is intended to be independent of the
value of <i>recordClass</i>, or if <i>dcterms:type</i> is intended to
be a subclass of <i>recordClass</i>
Occurrence (i.e. applicable only to resources that represent things
that can document Occurrences such as Images and PhysicalObjects). In
Gregor's email initiating this discussion he indicated that he felt
that they should be independent.&nbsp; But in John's proposal, the third
term: <i>basisOfRecord</i> is clearly intended to be a subclass of <i>dcterms:type</i>
with possible values of "StillImage", "MovingImage", "Sound",
"PreservedSpecimen", FossilSpecimen", LivingSpecimen",
"HumanObservation", "MachineObservation".&nbsp; Since all of these <i>basisOfRecord</i>
are the bases for documenting Occurrences, that insinuates that their
parent <i>dcterms:type</i> terms should fall under <i>recordClass</i>
Occurrence.&nbsp; <br>
<b>Problems with calling <i>basisOfRecord</i> a subclass of <i>dcterms:type</i>.&nbsp;
</b>PreservedSpecimen, FossilSpecimen, and LivingSpecimen can clearly
fall under PhysicalObject, but what do we do with the rest?&nbsp; <i>basisOfRecord
</i>terms StillImage and MovingImage could be subtypes of <i>dcterms:type</i>
Image, but what about a Sound?&nbsp; Is <i>basisOfRecord </i>Sound a
subtype of <i>dcterms:type</i> Sound?&nbsp; What about a 35mm slide
picturing an organism?&nbsp; It is an Image, but is also a PhysicalObject.&nbsp;
Gregor suggested that <i>basisOfRecord </i>HumanObservation and <i>basisOfRecord
</i>MachineObservation could be subtypes of <i>dcterms:type </i>Event
but I disagree.&nbsp; Just like observations, StillImages and
PreservedSpecimens have Event information associated with them (the
time and location of their creation) but we don't classify them as
Events.&nbsp; An Event is a conceptually different thing from the resource
that is created at that Event.&nbsp; <br>
<b>How does this change facilitate machine processing?&nbsp;</b> In John's
for comments, he quoted "3.3. Semantic changes in Darwin Core terms"
which mentioned "if ... such changes of meaning are likely to have
substantial impact on either machine processing of Darwin Core terms...
"&nbsp; It is not at all clear to me how the proposed reorganization of
these three terms (<i>recordClass</i>, <i>dcterms:type,</i> and <i>basisOfRecord</i>)
will facilitate machine processing, in particular because of the
problems in associating particular <i>basisOfRecord</i> terms with <i>dcterms:type</i>
terms as I discussed in the previous paragraph.&nbsp; From a
machine-processing standpoint, it makes a lot more sense to subclass <i>recordClass</i>
Occurrence as follows:<br>
<b>PhysicalObject </b>(including <i>BasisOfRecord</i>
"PreservedSpecimen", FossilSpecimen", LivingSpecimen", and any other
relevant material objects such as Seeds, FilmImage, etc.)<br>
<b>DigitalObject </b>(including <i>BasisOfRecord</i> "StillImage",
"MovingImage", "Sound", and any other relevant file-representable
objects such as DnaSequences)<br>
<b>NoObject </b>(including <i>BasisOfRecord</i>&nbsp; "HumanObservation",
The consuming application that is receiving the metadata can then know
if the record involves an Occurrence, if the record's subclass is: <br>
- PhysicalObject then there is an object somewhere that is not
deliverable through the Internet but which could be visited in an
herbarium or museum.<br>
- DigitalObject then there is a representational file that should be
retrieved and presented to the user of the application in an
appropriate way.<br>
- NoObject then there will only be metadata including measurements but
nothing for the user to see, hear, etc.<br>
Alternatively, rather than creating the three subclasses, simply create
a property for resources of the class Occurrence called "objectType"
and allow it to have values of PhysicalObject, DigitalObject, or
NoObject.&nbsp; This would serve the same purpose of informing the consuming
application of the nature of the resource without having to create
another hierarchical layer.&nbsp; From a machine-processing standpoint, I
don't see a great benefit to presenting a biodiversity-related
consuming application with both <i>dcterms:type,</i> and <i>basisOfRecord.</i><br>
<b>An alternative.&nbsp; </b>To me, trying to merge the <i>dcterms:type</i>
and its DCMI Type values together with the new DwC <i>recordClass</i>
and <i>BasisOfRecord</i>
is like trying to fit a square peg in a round hole.&nbsp; DCMI wasn't
created with biodiversity records in mind and its vocabulary really
doesn't mesh very well with DwC.&nbsp; I fully support the idea of creating
the new DwC term <i>recordClass</i> to contain what DwC formerly put
in <i>dcterms:type</i>.&nbsp; However, I think it would just be better to
leave the actual <i>dcterms:type</i> and its DCMI Type values as an
independent thing without trying to make DwC <i>basisOfRecord</i> its
subtype.&nbsp; Biodiversity media providers who need for their databases to
mesh with non-biodiversity records should assign <i>dcterms:type</i>
values to their records, non-media providers can if they want.&nbsp;
Biodiversity data providers (including those who provide media) should
assign <i>recordClass</i> and <i>BasisOfRecord</i> values to their
records.&nbsp; <br>
Steve Baskauf<br>
John R. WIECZOREK wrote:
  <pre wrap="">Gregor,

That sounds like a good solution to all of the problems. I would
propose that the basisOfRecord IS the the same thing as your proposed
dwc:subtype, so we should keep basisOfRecord.

Net solution:

1) keep dcterms:type
2) use DCType vocabulary to control dcterms:type (so, StillImage,
PhysicalObject, Event, etc.)
3) keep basisOfRecord
4) use our DwC-specific subtypes (PreservedSpecimen, FossilSpecimen,
HumanObservation, etc.) as the controlled vocabulary for basisOfRecord
without a formal type vocabulary (very close to how it is now, just
some of the terms would go to dcterms:type).
5) add a recordClass term
6) use the DwCType vocabulary to control the recordClass term instead
of the dcterms:type term.

This solutions fixes the Dublin Core - Darwin Core controlled
vocabulary problem, retains all existing terms, isolates the
controlled vocabulary that is specific to our domain, making it very
easy to expand without changes to the standard.

Any objections?


On Fri, Oct 23, 2009 at 12:33 PM, Gregor Hagedorn
<a class="moz-txt-link-rfc2396E" href="mailto:g.m.hagedorn@gmail.com">&lt;g.m.hagedorn@gmail.com&gt;</a> wrote:
  <blockquote type="cite">
    <blockquote type="cite">
      <pre wrap="">How about we retain basisOfRecord, but have it refine dcterms:type,
drop dcterms:type and add a "recordClass" term in its place that is
governed exactly as dcterms:type is currently being used in the
recently ratified version of the Core?
    <pre wrap="">recordClass for Taxon/Occurrence/Event sounds good.

I am less sure about keeping the "perspective-dependent"
basisOfRecord-term in a place where dcterms:type. The dcterms:type
vocabulary is, in principle, extensible, and meant to be extended.
Except, of course, some specific xml-implementation of dublin core
prevent this... To avoid problems with this one might desire to have
only the strict resource type vocabulary in dcterms:type. Then this
could by PhysicalObject/Event and a dwc:subtype added to express
PreservedSpecimen/MachineObservation etc. Essentially, MRTG intends to
use such a mrtg:subtype as well to differentiate different StillImage
or Text subtypes:
 <a class="moz-txt-link-freetext" href="http://www.keytonature.eu/wiki/MRTG_Schema_v0.8#Subtype">http://www.keytonature.eu/wiki/MRTG_Schema_v0.8#Subtype</a>

This would then mean, DarwinCore might support:


  <pre wrap=""><!---->.

<pre class="moz-signature" cols="72">-- 
Steven J. Baskauf, Ph.D., Senior Lecturer
Vanderbilt University Dept. of Biological Sciences

postal mail address:
VU Station B 351634
Nashville, TN  37235-1634,  U.S.A.

delivery address:
2125 Stevenson Center
1161 21st Ave., S.
Nashville, TN 37235

office: 2128 Stevenson Center
phone: (615) 343-4582,  fax: (615) 343-6707
<a class="moz-txt-link-freetext" href="http://bioimages.vanderbilt.edu">http://bioimages.vanderbilt.edu</a>