<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=UTF-8" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
A couple of points of clarification on what Chuck said:<br>
<br>
1. Audubon Core is more than an extension of Darwin Core - it's a
vocabulary that is a ratified TDWG technical specification standard
(despite what [1] says - nobody has managed to change its status from
"Draft" to "Current" on the website).  So it stands on the same level
as Darwin Core even though it's terms describe different kinds of
things than DwC.  All ratified TDWG standards have gone through peer
review, public comment, and approval by the TDWG Executive.  That is
not the case with Plinian Core or GBIF extensions.  <br>
<br>
2. The Darwin Core text guide that Chuck mentions IS actually part of
the Darwin Core Standard.  TDWG Standards are composed of normative
("Type 1") documents that define the standard and non-normative ("Type
2") documents that "explain and justify" the standard.  For Darwin
Core, there is a single normative RDF document that defines the
standard.  It can be viewed at
<a class="moz-txt-link-freetext" href="https://code.google.com/p/darwincore/source/browse/trunk/rdf/dwctermshistory.rdf">https://code.google.com/p/darwincore/source/browse/trunk/rdf/dwctermshistory.rdf</a> 
.  There are 67 non-normative documents, which include the entire
Darwin Core website (including the text guide page).  How do I know
that these documents comprise the standard?  Because they are what I
get when I download and unzip the standard from
<a class="moz-txt-link-freetext" href="http://www.tdwg.org/standards/450/">http://www.tdwg.org/standards/450/</a> .  It is one of TDWG's deficiencies
that it is not a simple matter to know what actually comprises a
standard and to view clearly-identified components of a standard
without having to download a zip archive.  <br>
<br>
I'm not sure that I can articulate the difference between the Darwin
Core Text Guide component of the standard and a "Darwin Core Archive". 
It might be correct to say that Darwin Core Archives are sets of files
that are compliant with the Darwin Core Text Guide.  <br>
<br>
Steve<br>
<br>
[1] <a class="moz-txt-link-freetext" href="http://www.tdwg.org/standards/">http://www.tdwg.org/standards/</a><br>
<br>
Chuck Miller wrote:
<blockquote
 cite="mid:059599138B8E5E4F9F90273125749230809BD29A@MBGMail02.mobot.org"
 type="cite">
  <meta http-equiv="Content-Type" content="text/html; ">
  <meta name="Generator" content="Microsoft Word 14 (filtered medium)">
  <style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {mso-style-priority:99;
        mso-style-link:"Balloon Text Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif";}
span.hoenzb
        {mso-style-name:hoenzb;}
span.BalloonTextChar
        {mso-style-name:"Balloon Text Char";
        mso-style-priority:99;
        mso-style-link:"Balloon Text";
        font-family:"Tahoma","sans-serif";}
span.EmailStyle20
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
  <div class="WordSection1">
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);">Rob,<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);">GBIF
is hard at work solving a problem for them.  It seems natural for them
to do what works best for them, particularly dealing with the
volume/scale they do.  And, Markus, Tim, Eamonn and others have been
deeply involved in Darwin Core standards implementation, inventing the
DwCA and the IPT in the first place. But, in using DwCA to get actual
work done for GBIF they have added a term here and there via their own
extensions. See <a moz-do-not-send="true"
 href="http://tools.gbif.org/dwca-validator/extensions.do">http://tools.gbif.org/dwca-validator/extensions.do</a>.
 It’s a long list of Registered and Stable extensions.  What about
Audubon and Plinian Core?  Aren’t they actually “extensions” to Darwin
Core, particularly in the “universal biodiversity data “ sense Darwin
Core seems to be evolving to?  Maybe we need a “SampleCore” or
“EventCore” that organizes these sampling/event-related terms?<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);">GBIF
is creating a new “Event core” for DwCA to do what they need to do. 
But, I don’t understand the problem with this.  Occurrence core, Taxon
core, Event core – so what? The DwCA model allows anything to be the
core (ignoring IPT) and it does not actually restrict the terms used to
DwC only, certainly it already includes Dublin Core and EML.  In fact,
lots of DwCA exchanges are being used outside GBIF now with extended
terms from Audubon Core, Plinian Core, and others.  How is this bad? 
It shows how flexible the DwCA data exchange structure is.  And, it is
an exchange, not a data storage format.  What’s the problem with an
Event core?<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);">As
an aside, I have said many times that the most confusing thing to our
community about DwCA is that it’s called <u>Darwin Core</u> Archive
when the structure is in fact not limited to only Darwin Core terms.
Any validatable XML term can be used – like </span><span
 style="font-size: 10pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"><a
 moz-do-not-send="true"
 href="http://rs.gbif.org/terms/1.0/verbatimLabel">http://rs.gbif.org/terms/1.0/verbatimLabel</a>
which is used in the How-To Guide Whales example. </span><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"> And
I commonly hear people at conferences and meetings now referring to
their plans to adopt “Darwin Core” and upon questioning discover they
are talking about the DwCA format, not really knowing the details of
it.  So, the words “Darwin Core” have become ambiguous.<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);">And 
I want to note that Darwin Core Archive is not a TDWG standard.  It is
a guideline for implementing the Darwin Core standard in text files. <a
 moz-do-not-send="true" href="http://rs.tdwg.org/dwc/terms/guides/text/">http://rs.tdwg.org/dwc/terms/guides/text/</a>. 
This is another point of confusion.  GBIF describes DwCA as “an
internationally recognized biodiversity informatics data standard” <a
 moz-do-not-send="true" href="http://www.gbif.org/resources/2551">http://www.gbif.org/resources/2551</a>,
but it’s not a TDWG standard, just a guideline.  I think DwCA deserves
to be made a TDWG data exchange standard on its own, separate from
Darwin Core, and perhaps expanded in scope to embrace the other “Cores”
and relabeled to “Biodiversity Data Archive” or something.<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);">Chuck<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 11pt; font-family: &quot;Calibri&quot;,&quot;sans-serif&quot;; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <p class="MsoNormal"><b><span
 style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;;">From:</span></b><span
 style="font-size: 10pt; font-family: &quot;Tahoma&quot;,&quot;sans-serif&quot;;">
<a class="moz-txt-link-abbreviated" href="mailto:tdwg-content-bounces@lists.tdwg.org">tdwg-content-bounces@lists.tdwg.org</a>
[<a class="moz-txt-link-freetext" href="mailto:tdwg-content-bounces@lists.tdwg.org">mailto:tdwg-content-bounces@lists.tdwg.org</a>] <b>On Behalf Of </b>Robert
Guralnick<br>
  <b>Sent:</b> Thursday, August 28, 2014 10:58 AM<br>
  <b>To:</b> John Deck<br>
  <b>Cc:</b> TDWG Content Mailing List; Ramona Walls<br>
  <b>Subject:</b> Re: [tdwg-content] tdwg-content Digest, Vol 63, Issue
6<o:p></o:p></span></p>
  <p class="MsoNormal"><o:p> </o:p></p>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  <div>
  <p class="MsoNormal">  Hi all --- Ok, I think the scope of the issue
is quite clear. Let me summarize:  1)  As Éamonn and the rest of GBIF
has made quite clear,  "<span
 style="font-size: 9.5pt; font-family: &quot;Arial&quot;,&quot;sans-serif&quot;;">GBIF is
faced with the immediate task of making sample-based data discoverable
and accessible using its current ecosystem of tools" given a funding
mandate from EU-BON.  2)  The solution for this problem is to develop
an Event-core and to promote new terms to the Darwin Core to make this
happen.   I will note a small inconsistency here:  the current
ecosystem standards and tools of is Darwin Core (as it stands) and
publishing systems such as IPT.  That ecosystem of tools includes
mechanisms to extend Darwin Core where needed, via extensions.  The <i>current</i>
ecosystem of tools doesn't include new Cores or new DwC terms, does it?</span><o:p></o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><span style="font-family: &quot;Arial&quot;,&quot;sans-serif&quot;;"> 
So this leads in nicely to the contentious issue(s) and places where
there seems to be discussions --- these have to do with the nature of
the changes suggested and the scope of those changes, both in terms of
an Event core and DwC term additions.  Leaving aside the Event-core for
now, the key questions simply about term additions to the Darwin Core
that seem to be at heart here are: 1)  Is the intent of the Darwin Core
to model surveys, which usually involve multiple kinds and types of
sampling over multiple sites using multiple methods?  2)  Is the
solution to invent new terms for the Darwin Core if there are already
terms from other efforts, wouldn't we work with those existing efforts
to assure interoperability? </span><o:p></o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><span style="font-family: &quot;Arial&quot;,&quot;sans-serif&quot;;"> 
 I appreciate the efforts of GBIF here fully, and am personally torn
because on the one hand, I fully agree with the goal of extending
Darwin Core to better represent  richer biodiversity data. On the other
hand, I worry about process here and how to make that happen in a way
that isn't too hasty or locks us into just the opposite of what I think
many of us want with regards to sharing data more broadly than within
just one ecosystem of tools. </span><o:p></o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><span style="font-family: &quot;Arial&quot;,&quot;sans-serif&quot;;">Best,
Rob</span><o:p></o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><span
 style="font-size: 9.5pt; font-family: &quot;Arial&quot;,&quot;sans-serif&quot;;">  </span><o:p></o:p></p>
  </div>
  </div>
  <div>
  <p class="MsoNormal" style="margin-bottom: 12pt;"><o:p> </o:p></p>
  <div>
  <p class="MsoNormal">On Thu, Aug 28, 2014 at 6:30 AM, John Deck &lt;<a
 moz-do-not-send="true" href="mailto:jdeck@berkeley.edu" target="_blank">jdeck@berkeley.edu</a>&gt;
wrote:<o:p></o:p></p>
  <div>
  <div>
  <p class="MsoNormal"><span
 style="font-family: &quot;Arial&quot;,&quot;sans-serif&quot;; color: rgb(80, 0, 80);">I
see the rational for enabling this in Darwin Core Archives and adding
the new terms.  However, back to what Matt Jones brought up: "</span><span
 style="font-size: 9.5pt; font-family: &quot;Arial&quot;,&quot;sans-serif&quot;; color: rgb(80, 0, 80);">won't
we just end up with a new syntax that does essentially what O&amp;M and
OBOE do now?".  </span><o:p></o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal" style="margin-bottom: 12pt;"><span
 style="font-size: 9.5pt; font-family: &quot;Arial&quot;,&quot;sans-serif&quot;; color: rgb(80, 0, 80);">We
should include explicit references to existing terms/definitions that
encapsulate what we're talking about, e.g. in our MaterialSample
proposal last year we linked the an existing term in OBI, which has a
much richer description and context for MaterialSample than what we
considered (</span><span
 style="font-family: &quot;Arial&quot;,&quot;sans-serif&quot;; color: rgb(80, 0, 80);"><a
 moz-do-not-send="true"
 href="https://code.google.com/p/darwincore/issues/detail?id=167"
 target="_blank">https://code.google.com/p/darwincore/issues/detail?id=167</a>) </span><o:p></o:p></p>
  </div>
  <div>
  <div>
  <p class="MsoNormal">Have we explored the possibility of doing this
with OBOE?  I'm not suggesting we adopt OBOE wholesale, but it seems
like we have a good opportunity to enable better semantic linking with
that efforts.<o:p></o:p></p>
  </div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal">John<o:p></o:p></p>
  </div>
  <div>
  <div>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  <div>
  <p class="MsoNormal">On Thu, Aug 28, 2014 at 4:23 AM, Éamonn Ó Tuama
[GBIF] &lt;<a moz-do-not-send="true" href="mailto:eotuama@gbif.org"
 target="_blank">eotuama@gbif.org</a>&gt; wrote:<o:p></o:p></p>
  <p class="MsoNormal">Thanks, Ramona and Rob.<br>
  <br>
I'd like to add a few points following on Markus's reply.<br>
  <br>
I think your pressing of the need for a robust semantic model for<br>
biodiversity sample/survey data is incontestable – we do need one and it<br>
should enable rich data integration once it is defined and the tools and<br>
data standards to support it become available. However, GBIF is faced
with<br>
the immediate task of making sample-based data discoverable and
accessible<br>
using its current ecosystem of tools (IPT) and exchange standards (DwC;<br>
EML). Waiting for a functional, implementable semantic model and the
tools<br>
and support services for it is just not an option for us right now.<br>
  <br>
We have already spend considerable time in analysing the merits of<br>
Occurrence core vs Event core and have opted for an Event core for
reasons<br>
previously given. I don’t believe we are trying to reconfigure Event
(“an<br>
action that occurs at a place and during a period of time”) and
regardless<br>
of whether we use Occurrence or Event, the need for some additional
terms<br>
arise (e.g., quantity, quantityType, samplingGeometry, samplingUnit).
Once<br>
the BCO model is available for uptake, it should be possible to develop
a<br>
mapping between it and the simple DwC sample model.<br>
  <br>
So GBIF’s stance is that we need to take a two-pronged approach by
exploring<br>
how the IPT and DwC-A can be adapted for publishing sample-based data
in the<br>
near term while supporting the work of TDWG and groups such as the BCO
in<br>
advancing biodiversity informatics. GBIF has already engaged in the
work of<br>
the BCO and will continue to do so.<br>
  <span style="color: rgb(136, 136, 136);"><br>
Éamonn</span><o:p></o:p></p>
  <div>
  <p class="MsoNormal"><br>
-----Original Message-----<br>
From: <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a><br>
[mailto:<a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>]
On Behalf Of Markus Döring<br>
Sent: 28 August 2014 12:44<br>
To: Ramona Walls<br>
Cc: TDWG Content Mailing List<o:p></o:p></p>
  </div>
  <div>
  <div>
  <p class="MsoNormal">Subject: Re: [tdwg-content] tdwg-content Digest,
Vol 63, Issue 6<br>
  <br>
Hi Ramona &amp; Rob,<br>
  <br>
The Event proposal does not try to change the semantics of an Event, it
just<br>
uses the existing Darwin Core Event "class" at the core in Darwin Core<br>
archives. The actual change proposed is simply adding 3 new terms to the<br>
Event "group" to better share information about sampling methods &amp;
efforts,<br>
extending the existing limited capabilities of Darwin Core which
already has<br>
the terms dwc:samplingProtocol and dwc:samplingEffort. It also proposes
2<br>
new terms for dealing with quantity of Occurrences, something that has
been<br>
discussed since 2012 now, when I had proposed a new abundance term [2].<br>
  <br>
  <br>
In general application of Darwin Core is not at all limited to
specimens and<br>
observations. It is used for sharing taxonomic datasets already and it's<br>
definition and goal is broad. Let me cite some of the introduction to
Darwin<br>
Core [1]:<br>
  <br>
What is the Darwin Core?<br>
The Darwin Core is body of standards. It includes a glossary of terms
(in<br>
other contexts these might be called properties, elements, fields,
columns,<br>
attributes, or concepts) intended to facilitate the sharing of
information<br>
about biological diversity by providing reference definitions,
examples, and<br>
commentaries. The Darwin Core is primarily based on taxa, their
occurrence<br>
in nature as documented by observations, specimens, samples, and related<br>
information.<br>
  <br>
Motivation: The Darwin Core standard was originally conceived to
facilitate<br>
the discovery, retrieval, and integration of information about modern<br>
biological specimens, their spatiotemporal occurrence, and their
supporting<br>
evidence housed in collections (physical or digital). The Darwin Core
today<br>
is broader in scope and more versatile. It is meant to provide a stable<br>
standard reference for sharing information on biological diversity. As a<br>
glossary of terms, the Darwin Core is meant to provide stable semantic<br>
definitions with the goal of being maximally reusable in a variety of<br>
contexts.<br>
  <br>
  <br>
Markus<br>
  <br>
  <br>
[1] <a moz-do-not-send="true" href="http://rs.tdwg.org/dwc/index.htm"
 target="_blank">http://rs.tdwg.org/dwc/index.htm</a><br>
[2] <a moz-do-not-send="true"
 href="https://code.google.com/p/darwincore/issues/detail?id=142"
 target="_blank">https://code.google.com/p/darwincore/issues/detail?id=142</a><br>
  <br>
  <br>
--<br>
Markus Döring<br>
Software Developer<br>
Global Biodiversity Information Facility (GBIF)<br>
  <a moz-do-not-send="true" href="mailto:mdoering@gbif.org"
 target="_blank">mdoering@gbif.org</a><br>
  <a moz-do-not-send="true" href="http://www.gbif.org" target="_blank">http://www.gbif.org</a><br>
  <br>
  <br>
  <br>
  <br>
  <br>
On 27 Aug 2014, at 18:57, Ramona Walls &lt;<a moz-do-not-send="true"
 href="mailto:rlwalls2008@gmail.com" target="_blank">rlwalls2008@gmail.com</a>&gt;
wrote:<br>
  <br>
&gt; I think it is important to consider the purpose of both Darwin
Core and<br>
DwC archives  in deciding whether or not to expand them, but we should
use<br>
that consideration to address the question at hand, which is whether or
not<br>
to add an Event core and additional properties to describe events.<br>
&gt;<br>
&gt; Describing the exchange format before the semantics is the wrong
way to<br>
go, given that we now have a framework for developing semantics.
Expanding<br>
Darwin Core before we adequately model survey data is bound to lead to<br>
problems later, when we try to retro-fit the semantics to Darwin Core
Event<br>
archives. This is exactly the problem we are running into now with
Occurance<br>
archives, and we have the opportunity to avoid it.<br>
&gt;<br>
&gt; I suggest we first use existing ontologies to model survey data,
then deal<br>
with if and how to exchange that information in DwC-A. This is what I
was<br>
hinting at in my first email, but should have said more explicitly.<br>
&gt;<br>
&gt; Ramona<br>
&gt;<br>
&gt; ------------------------------------------------------<br>
&gt; Ramona L. Walls, Ph.D.<br>
&gt; Scientific Analyst, The iPlant Collaborative, University of Arizona<br>
&gt; Research Associate, Bio5 Institute, University of Arizona<br>
&gt; Laboratory Research Associate, New York Botanical Garden<br>
&gt;<br>
&gt;<br>
&gt; On Wed, Aug 27, 2014 at 9:14 AM, Robert Guralnick<br>
&lt;<a moz-do-not-send="true"
 href="mailto:Robert.Guralnick@colorado.edu" target="_blank">Robert.Guralnick@colorado.edu</a>&gt;
wrote:<br>
&gt;<br>
&gt;   It may be a sensible view for Darwin Core Archives and their
intended<br>
use, but Tim's email suggests we should be putting the method of
delivery<br>
ahead of the standard that delivers that content.  If this was just
about<br>
DwC-As, why not develop a survey extension that links each occurrence to<br>
information about the survey process using the existing star-schema
methods<br>
we have in place?  Why are we discussing adding terms to the Darwin
Core or<br>
trying to fully reconfigure what we call an Event?  That is what is on
the<br>
table, not DwC-As and how we use them.  Or am I missing something?<br>
&gt;<br>
&gt; Best, Rob<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On Wed, Aug 27, 2014 at 10:01 AM, Ramona Walls &lt;<a
 moz-do-not-send="true" href="mailto:rlwalls2008@gmail.com"
 target="_blank">rlwalls2008@gmail.com</a>&gt;<br>
wrote:<br>
&gt; Thanks, Tim, and yes, DwC-A as a view (but not necessarily the
primary<br>
archive) of data seems like the right point of view.<br>
&gt;<br>
&gt; Ramona<br>
&gt;<br>
&gt; ------------------------------------------------------<br>
&gt; Ramona L. Walls, Ph.D.<br>
&gt; Scientific Analyst, The iPlant Collaborative, University of Arizona<br>
&gt; Research Associate, Bio5 Institute, University of Arizona<br>
&gt; Laboratory Research Associate, New York Botanical Garden<br>
&gt;<br>
&gt;<br>
&gt; On Wed, Aug 27, 2014 at 1:58 AM, Tim Robertson &lt;<a
 moz-do-not-send="true" href="mailto:trobertson@gbif.org"
 target="_blank">trobertson@gbif.org</a>&gt;<br>
wrote:<br>
&gt; Hi Ramona,<br>
&gt;<br>
&gt; Those are good points, and I’d like to come back to the original
thinking<br>
behind the DwC-A.<br>
&gt;<br>
&gt; It was designed and intended to be a simple way of exposing a
complete<br>
view of a dataset, primarily for building sophisticated indexes,
inventories<br>
and allowing basic analytics (e.g. GBIF.org being one sophisticated
index).<br>
We found that the star schema provided the flexibility to do a lot, and
with<br>
the bundled metadata (e.g. EML) was enough to trace provenance and allow<br>
users to determine if the dataset might be fit for various uses.  In
many<br>
cases this represents the complete (e.g. lossless) view of a dataset.<br>
&gt;<br>
&gt; What we are discussing here are far richer datasets, where
shoe-horning<br>
content into the star schema becomes lossy for some, although we’re
finding<br>
other cases where it is indeed lossless.  I believe we should be
looking to<br>
harmonise ontologies / models etc as you mention but in parallel we
should<br>
define one or more star schema views that can still be used for
discovery /<br>
reporting / basic analytical purpose, and not long term archival of the<br>
dataset.  The dataset would then have the canonical rich form and an<br>
additional DwC-A view.  What I write here is applicable to all content
types<br>
of course.<br>
&gt;<br>
&gt; Please also note that many people put supplementary files in the
DwC-A<br>
which are ignored by DwC-A readers but could be a way of keeping the
richer<br>
view in the bundle.  If one wished you can describe those supplementary<br>
files in the EML document.<br>
&gt;<br>
&gt; Does this gel with the view of others as well?<br>
&gt;<br>
&gt; Cheers,<br>
&gt; Tim<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On 27 Aug 2014, at 02:55, Ramona Walls &lt;<a
 moz-do-not-send="true" href="mailto:rlwalls2008@gmail.com"
 target="_blank">rlwalls2008@gmail.com</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt; I think Matt hit the nail on the head. Although Darwin Core
can be used<br>
to exchange survey data, it lacks the semantics and structure necessary
to<br>
archive the data without loss of information. I think the biodiversity<br>
community would be better served devoting energy to harmonizing existing<br>
technologies such as OGC, OBOE, and BCO, not to mention the many
database<br>
for storing plot or survey data. The goal should be to preserve the
data in<br>
the most informative manner possible.<br>
&gt;&gt;<br>
&gt;&gt; There is a strong a case for wanting to search across all
evidence for<br>
occurences, including surveys and point occurences, so I can see
possible<br>
demand for a tool that would extract occurences from survey data to a
DwC<br>
archive. However, I am very concerned that making a DwC archive the
primary<br>
exchange format for survey or plot data commits us to a path of losing<br>
information from the start, for all but the simplest sampling schemas.<br>
&gt;&gt;<br>
&gt;&gt; Ramona<br>
&gt;&gt;<br>
&gt;&gt; ------------------------------------------------------<br>
&gt;&gt; Ramona L. Walls, Ph.D.<br>
&gt;&gt; Scientific Analyst, The iPlant Collaborative, University of
Arizona<br>
&gt;&gt; Research Associate, Bio5 Institute, University of Arizona<br>
&gt;&gt; Laboratory Research Associate, New York Botanical Garden<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Fri, Aug 22, 2014 at 3:00 AM, &lt;<a moz-do-not-send="true"
 href="mailto:tdwg-content-request@lists.tdwg.org" target="_blank">tdwg-content-request@lists.tdwg.org</a>&gt;<br>
wrote:<br>
&gt;&gt; Send tdwg-content mailing list submissions to<br>
&gt;&gt;         <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt;<br>
&gt;&gt; To subscribe or unsubscribe via the World Wide Web, visit<br>
&gt;&gt;         <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt; or, via email, send a message with subject or body 'help' to<br>
&gt;&gt;         <a moz-do-not-send="true"
 href="mailto:tdwg-content-request@lists.tdwg.org" target="_blank">tdwg-content-request@lists.tdwg.org</a><br>
&gt;&gt;<br>
&gt;&gt; You can reach the person managing the list at<br>
&gt;&gt;         <a moz-do-not-send="true"
 href="mailto:tdwg-content-owner@lists.tdwg.org" target="_blank">tdwg-content-owner@lists.tdwg.org</a><br>
&gt;&gt;<br>
&gt;&gt; When replying, please edit your Subject line so it is more
specific<br>
&gt;&gt; than "Re: Contents of tdwg-content digest..."<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Today's Topics:<br>
&gt;&gt;<br>
&gt;&gt;    1. Re: Darwin Core: proposed news terms for expressing
sample<br>
&gt;&gt;       data (Matt Jones)<br>
&gt;&gt;    2. Re: Darwin Core: proposed news terms for expressing     
 sample<br>
&gt;&gt;       data (Donald Hobern [GBIF])<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;
----------------------------------------------------------------------<br>
&gt;&gt;<br>
&gt;&gt; Message: 1<br>
&gt;&gt; Date: Thu, 21 Aug 2014 18:52:06 -0800<br>
&gt;&gt; From: Matt Jones &lt;<a moz-do-not-send="true"
 href="mailto:jones@nceas.ucsb.edu" target="_blank">jones@nceas.ucsb.edu</a>&gt;<br>
&gt;&gt; Subject: Re: [tdwg-content] Darwin Core: proposed news terms
for<br>
&gt;&gt;         expressing sample data<br>
&gt;&gt; To: ?amonn ? Tuama [GBIF] &lt;<a moz-do-not-send="true"
 href="mailto:eotuama@gbif.org" target="_blank">eotuama@gbif.org</a>&gt;<br>
&gt;&gt; Cc: TDWG Content Mailing List &lt;<a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a>&gt;<br>
&gt;&gt; Message-ID:<br>
&gt;&gt;<br>
&lt;CAFSW8xkx7uRP9PC2g3=<a moz-do-not-send="true"
 href="mailto:JT_VJanqujH8nPXoz8GXwh%2BJwKw5Ccw@mail.gmail.com"
 target="_blank">JT_VJanqujH8nPXoz8GXwh+JwKw5Ccw@mail.gmail.com</a>&gt;<br>
&gt;&gt; Content-Type: text/plain; charset="utf-8"<br>
&gt;&gt;<br>
&gt;&gt; This proposal is treading on ground that is quite similar to
other<br>
&gt;&gt; observations and measurements standards for data exchange that
are<br>
already<br>
&gt;&gt; mature, in particular:<br>
&gt;&gt;<br>
&gt;&gt; * OGC Observations and Measurements (<br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://www.opengeospatial.org/standards/om" target="_blank">http://www.opengeospatial.org/standards/om</a>)<br>
&gt;&gt; * Extensible Observation Ontology (OBOE;<br>
&gt;&gt; <a moz-do-not-send="true"
 href="https://semtools.ecoinformatics.org/oboe" target="_blank">https://semtools.ecoinformatics.org/oboe</a>)<br>
&gt;&gt;<br>
&gt;&gt; The former is a standard and broadly deployed, whereas the
latter is part<br>
&gt;&gt; of a research program in the use of ontologies for
measurements.  Through<br>
&gt;&gt; collaboration between the two projects, they've been modified
to be<br>
&gt;&gt; reasonably isomorphic, but O&amp;M uses an XML serialization
while OBOE uses<br>
an<br>
&gt;&gt; OWL-DL serialization. They largely express the same
measurements and<br>
&gt;&gt; sampling model once one gets beyond the terminology
differences.<br>
&gt;&gt;<br>
&gt;&gt; So, I'm wondering if it make much sense to extend Darwin Core,
which is<br>
at<br>
&gt;&gt; heart an Occurrence exchange syntax, into this measurements
area that is<br>
&gt;&gt; well represented by these other existing specifications?  I'm
curious to<br>
&gt;&gt; hear why people would even want to do this.  And if we do go
down this<br>
&gt;&gt; path, won't we just end up with a new syntax that does
essentially what<br>
O&amp;M<br>
&gt;&gt; and OBOE do now?<br>
&gt;&gt;<br>
&gt;&gt; Matt<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Thu, Aug 21, 2014 at 12:22 AM, ?amonn ? Tuama [GBIF]<br>
&lt;<a moz-do-not-send="true" href="mailto:eotuama@gbif.org"
 target="_blank">eotuama@gbif.org</a>&gt;<br>
&gt;&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; &gt; Hi Rob, Anne, Rich,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I think Markus has answered your question as to why we
opted for an<br>
Event<br>
&gt;&gt; &gt; core which is being used in the sense described by Anne
and Rich. For<br>
any<br>
&gt;&gt; &gt; event, you can have a list of species in an Occurrence
extension and<br>
for<br>
&gt;&gt; &gt; each species, you can include quantity and quantityType,
e.g., biomass,<br>
&gt;&gt; &gt; etc. The proposed term eventSeriesID was intended for
linking together<br>
&gt;&gt; &gt; related events, although it now looks like parentEventID
might be a<br>
better,<br>
&gt;&gt; &gt; more flexible term. The measurementOrFact extension is a
good fit for<br>
&gt;&gt; &gt; capturing environmental information relating to an event.
See, e.g.,<br>
the<br>
&gt;&gt; &gt; Gialova Lagoon brackish water invertebrate test data set
[1] where a<br>
set<br>
&gt;&gt; &gt; of 18 environmental variables, including temp, pH, Rdx,
particulate<br>
organic<br>
&gt;&gt; &gt; matter, dissolved oxygen, salinity, chlorophyll-a were
measured for<br>
each<br>
&gt;&gt; &gt; sampling station-sampling period combination. An example
mapping is:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Id            measurementType           measurementValue<br>
&gt;&gt; &gt; measurementUnit               measurementRemarks<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; IA           Tmp (sed)                           21.5<br>
&gt;&gt; &gt;                               degree C                   
         Tmp<br>
&gt;&gt; &gt; (sed): temperature at the bottom surface<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; **Controlled vocabularies**<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Ideally, the values for samplingUnit and quantityType
would be selected<br>
&gt;&gt; &gt; from controlled vocabularies. This is, effectively, what
we do by<br>
&gt;&gt; &gt; presenting a small list of values in a drop-down menu.
The current<br>
values<br>
&gt;&gt; &gt; are what we derived for example data sets and discussion
but they can<br>
&gt;&gt; &gt; undoubtedly be extended and improved.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; We capture ?bucket? type measures through a combination of<br>
samplingEffort,<br>
&gt;&gt; &gt; samplingGeometry and samplingUnit. For example, a pitfall
trap (in a<br>
point<br>
&gt;&gt; &gt; location) left out for 16 days might have samplingEffort:
16,<br>
&gt;&gt; &gt; samplingGeometry: point and samplingUnit: day. Three m^2
quadrats in a<br>
&gt;&gt; &gt; shore survey might have samplingEffort: 3,
samplingGeometry: area and<br>
&gt;&gt; &gt; samplingUnit: m^2.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; It would be very useful to see your compilation of scope,
effort and<br>
&gt;&gt; &gt; completeness measures to see if we can express them in
our model and/or<br>
if<br>
&gt;&gt; &gt; we need to reconsider our approach.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ?amonn<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [1] <a moz-do-not-send="true"
 href="http://eubon-ipt.gbif.org/resource.do?r=ionian-brackish-lagoon"
 target="_blank">http://eubon-ipt.gbif.org/resource.do?r=ionian-brackish-lagoon</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *From:* <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>
[mailto:<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>]
*On Behalf Of *Markus D?ring<br>
&gt;&gt; &gt; *Sent:* 20 August 2014 23:47<br>
&gt;&gt; &gt; *To:* Robert Guralnick<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *Cc:* TDWG Content Mailing List<br>
&gt;&gt; &gt; *Subject:* Re: [tdwg-content] Darwin Core: proposed news
terms for<br>
&gt;&gt; &gt; expressing sample data<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Rob,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; this proposal if for monitoring surveys really, not to be
confused with<br>
&gt;&gt; &gt; material samples like environmental or tissue samples
which have a<br>
distinct<br>
&gt;&gt; &gt; new dwc class MaterialSample.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; We tend to overload the term sampling a lot and it helps
treating<br>
material<br>
&gt;&gt; &gt; samples different from pure observational "sampling".
That is why the<br>
&gt;&gt; &gt; existing Event class was used as the core and classic
Occurrence<br>
records as<br>
&gt;&gt; &gt; extensions. A classic example is a vegetation survey
where each plot<br>
&gt;&gt; &gt; represents an Event record and each recorded species in
that plot will<br>
be<br>
&gt;&gt; &gt; an Occurrence extension record with a given quantity.
Darwin Core<br>
already<br>
&gt;&gt; &gt; offers individualCount to specify quantity, but it is a
very specific<br>
way<br>
&gt;&gt; &gt; of measuring "abundance" restricted to only some use
cases. Abiotic<br>
&gt;&gt; &gt; measurements about the plot (e.g. soil type, pH,
temperature) can be<br>
&gt;&gt; &gt; published using the measurements or facts extension
linked to the Event<br>
&gt;&gt; &gt; core.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Markus<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On 20 Aug 2014, at 20:08, Robert Guralnick<br>
&lt;<a moz-do-not-send="true"
 href="mailto:Robert.Guralnick@colorado.edu" target="_blank">Robert.Guralnick@colorado.edu</a>&gt;<br>
&gt;&gt; &gt; wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;   Anne -- I don't know the answers!  These are questions
for Eamonn.  I<br>
&gt;&gt; &gt; would presume that a sample could be a jumble of species
or even just<br>
water<br>
&gt;&gt; &gt; or soil samples, and biomass would refer to that sample -
but maybe<br>
that<br>
&gt;&gt; &gt; isn't a use case being considered?  The examples given in
the longer<br>
&gt;&gt; &gt; document all link an event_id to species name and some
measure of<br>
quantity<br>
&gt;&gt; &gt; for that species (to the species, not an individual
specimen), so I<br>
assume<br>
&gt;&gt; &gt; that is the prevailing (or only) case?<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Best, Rob<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On Wed, Aug 20, 2014 at 11:56 AM, Anne Thessen &lt;<a
 moz-do-not-send="true" href="mailto:annethessen@gmail.com"
 target="_blank">annethessen@gmail.com</a>&gt;<br>
&gt;&gt; &gt; wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Hi Rob<br>
&gt;&gt; &gt; I would like to respond to your item number 2.<br>
&gt;&gt; &gt; From my perspective, I deal with lots of published
descriptions of<br>
taxa.<br>
&gt;&gt; &gt; The text might say something like "I saw species A in the
Chesapeake<br>
Bay,<br>
&gt;&gt; &gt; the Adriatic Sea and the Indian Ocean and the biomass is
5 - 9 grams".<br>
The<br>
&gt;&gt; &gt; biomass range obviously corresponds to at least three
different<br>
&gt;&gt; &gt; occurrences, but how to divide the biomass data? I would
love to be<br>
able to<br>
&gt;&gt; &gt; have an *event* to attach it all to. There is almost two
different<br>
levels<br>
&gt;&gt; &gt; of events - a sampling event and a "study event". The
"study event"<br>
would<br>
&gt;&gt; &gt; correspond to the type of event I would like to use in
the above<br>
example.<br>
&gt;&gt; &gt; It may not be ideal, but for the old literature that
might be the best<br>
we<br>
&gt;&gt; &gt; can do.<br>
&gt;&gt; &gt; I have to admit that I don't know enough about trawl data
to understand<br>
&gt;&gt; &gt; why an event core would be a problem. It seems that the
trawl would be<br>
an<br>
&gt;&gt; &gt; event and each biomass measure (of each fish) would be
attached to a<br>
&gt;&gt; &gt; separate occurrence which is attached to that event. Am I
understanding<br>
&gt;&gt; &gt; this wrong?<br>
&gt;&gt; &gt; btw - I found a workaround for the example I gave, so
it's not<br>
impossible<br>
&gt;&gt; &gt; to model with the current structure....<br>
&gt;&gt; &gt; Anne<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On 8/20/2014 1:16 PM, Robert Guralnick wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ?amonn et al. --- Thanks for the clarifications.  I think
these help a<br>
ton<br>
&gt;&gt; &gt; but it raises a couple more questions for me.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 1)   I am surprised that you plan to use of
MeasurementorFact extension<br>
in<br>
&gt;&gt; &gt; relation to the Event core, which seems like a novel (or
perhaps<br>
awkward or<br>
&gt;&gt; &gt; unintended?) mechanism for capturing environmental data,
but the same<br>
&gt;&gt; &gt; extension was not be seen as relevant for describing
samples? Can you<br>
&gt;&gt; &gt; explain more about the thinking there?<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 2)  There may be a subtle issue here extending "Event" to
be more what<br>
you<br>
&gt;&gt; &gt; call a "Sampling Event Core".  My read of this is that
Darwin Core<br>
serves<br>
&gt;&gt; &gt; as a way to deal with point occurrences and Event
reflects the context<br>
of a<br>
&gt;&gt; &gt; single capture event (whether a single observation, or a
bulk sample<br>
&gt;&gt; &gt; capture).  The changes recommended seem to dramatically
extend and<br>
change<br>
&gt;&gt; &gt; that meaning?  Its simply a question that I don't have
answer to, but<br>
is<br>
&gt;&gt; &gt; Darwin Core, the right vehicle to start capturing
repeated measures of<br>
&gt;&gt; &gt; biomass values from trawls?   I don't have answer but
man, terms like<br>
&gt;&gt; &gt; quantityType (as a property of occurrence?) give me pause.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 3)  Is Sampling Unit a controlled vocabulary? For another
project, I<br>
have<br>
&gt;&gt; &gt; looked through - and captured scope, effort and
completeness measures<br>
from<br>
&gt;&gt; &gt; - a large number of published biotic area inventories. 
The vast<br>
majorities<br>
&gt;&gt; &gt; of these are measured in units like bucket hours, or trap
nights.  Is a<br>
&gt;&gt; &gt; "bucket" part of SamplingGeometry or Sampling Unit?  I'd
be happy to<br>
send<br>
&gt;&gt; &gt; along all the many examples of how biotic inventories of
an area are<br>
&gt;&gt; &gt; completed and perhaps it might be good to see how those
might be<br>
&gt;&gt; &gt; represented using the terms you are proposing?<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Best, Rob<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On Wed, Aug 20, 2014 at 10:16 AM, Richard Pyle<br>
&lt;<a moz-do-not-send="true" href="mailto:deepreef@bishopmuseum.org"
 target="_blank">deepreef@bishopmuseum.org</a>&gt;<br>
&gt;&gt; &gt; wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Same here ? Events are central to the work that we do.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Aloha,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Rich<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *From:* <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>
[mailto:<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>]
*On Behalf Of *Anne Thessen<br>
&gt;&gt; &gt; *Sent:* Wednesday, August 20, 2014 2:59 AM<br>
&gt;&gt; &gt; *To:* <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *Subject:* Re: [tdwg-content] Darwin Core: proposed news
terms for<br>
&gt;&gt; &gt; expressing sample data<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Hello<br>
&gt;&gt; &gt; I would just like to comment on *event core*.<br>
&gt;&gt; &gt; I've been doing a lot of work translating published data
into Darwin<br>
Core.<br>
&gt;&gt; &gt; During that process I've wished several times that I
could use Event as<br>
&gt;&gt; &gt; core. I am happy to hear about that proposed change. It
will make it<br>
easier<br>
&gt;&gt; &gt; to model the data I am working with.<br>
&gt;&gt; &gt; Anne<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On 8/20/2014 7:04 AM, ?amonn ? Tuama [GBIF] wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Hi Rob,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Thank you for the feedback. I have tried to address the
two main issues<br>
&gt;&gt; &gt; you raise below. At the outset, I would like to emphasise
that much of<br>
this<br>
&gt;&gt; &gt; work is taking place in the context of the EU BON project
which<br>
includes a<br>
&gt;&gt; &gt; task on developing/enhancing tools and standards for data
sharing with<br>
a<br>
&gt;&gt; &gt; particular focus on the IPT for publishing sample-based
data. So, we<br>
were<br>
&gt;&gt; &gt; constrained by the need to publish sample-based data sets
in the Darwin<br>
&gt;&gt; &gt; Core Archive format and to demonstrate practical
application using a<br>
&gt;&gt; &gt; working prototype. When the discussion on the TDWG list
faded out, we<br>
took<br>
&gt;&gt; &gt; it to our EU BON partners whose requirements were
essential input to<br>
&gt;&gt; &gt; further development. We recognise that these discussions
took place<br>
away<br>
&gt;&gt; &gt; from TDWG (although the TDWG/EU BON contributors
overlapped) and this<br>
is<br>
&gt;&gt; &gt; the reason we are presenting  the outcomes here for
further<br>
consideration.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; **Event core**<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; As the SIGS report indicated, sample data can be modelled
in Darwin<br>
Core<br>
&gt;&gt; &gt; Archives using either Occurrence or Event as core. This
was the<br>
starting<br>
&gt;&gt; &gt; point for our evaluation but as things progressed the
data wrangling<br>
pushed<br>
&gt;&gt; &gt; the model back towards the Event core. We actually went
through the<br>
&gt;&gt; &gt; exercise of mapping multiple test datasets in an
iterative process<br>
spanning<br>
&gt;&gt; &gt; several months' work. In the end, we found that using an
Event core<br>
better<br>
&gt;&gt; &gt; matched the typical sample data we were dealing with,
allowing use of a<br>
&gt;&gt; &gt; measurement-or-fact extension to be included for the
efficient<br>
expression<br>
&gt;&gt; &gt; of environmental information associated with the event.
The choice<br>
comes<br>
&gt;&gt; &gt; down to an Occurrence core or an Event core + Occurrence
extension. In<br>
both<br>
&gt;&gt; &gt; cases, the true observation records are Occurrences. The
big difference<br>
is<br>
&gt;&gt; &gt; what type the core has and therefore to which kind of
records you can<br>
&gt;&gt; &gt; attach further facts and extra information with DwC-A
extensions. Many<br>
&gt;&gt; &gt; sampling datasets have very rich information about the
site and event,<br>
so<br>
&gt;&gt; &gt; it is very natural to hang facts from an Event core. When
picking the<br>
&gt;&gt; &gt; Occurrence core those facts would have to be repeated for
each and<br>
every<br>
&gt;&gt; &gt; occurrence record. Moreover, our approach doesn?t stop
anyone from<br>
using<br>
&gt;&gt; &gt; the Occurrence core if they so wish. This just provides a
different<br>
option<br>
&gt;&gt; &gt; for datasets that better fit an Event core model.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; I want to stress that we are not building a ?specific IPT
version? to<br>
&gt;&gt; &gt; support an Event core but, rather, we adapted the IPT so
that it can be<br>
&gt;&gt; &gt; configured to support any generic ?core + extension?
format to enable<br>
its<br>
&gt;&gt; &gt; use for exploration of more data formats.  This is part
of the core<br>
&gt;&gt; &gt; codebase and there were no custom forks of the IPT for
this work.  Our<br>
view<br>
&gt;&gt; &gt; at GBIF is that if there are significant numbers of data
publishers who<br>
are<br>
&gt;&gt; &gt; keen to adopt, promote and use a (any) format, and the
tools can be<br>
&gt;&gt; &gt; configured to do so, then we should support it, and, if
necessary, use<br>
a<br>
&gt;&gt; &gt; custom namespace.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; **New terms around abundance**<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Yes, the discussion on TDWG did fade out but it was clear
that the term<br>
&gt;&gt; &gt; ?abundance?  as recommended by the SIGS report (along with<br>
&gt;&gt; &gt; abundanceAsPercent) was confusing many when we were
looking for term(s)<br>
&gt;&gt; &gt; that reported quantitative measures of organisms in a
sample. It also<br>
&gt;&gt; &gt; became clear we would need to be able to state the type
of quantity<br>
being<br>
&gt;&gt; &gt; measured. An alternative suggestion for using the
MeasurementsOrFact<br>
class<br>
&gt;&gt; &gt; was immediately shot down.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; As some of our main use cases were coming from the EU BON
project,<br>
&gt;&gt; &gt; discussion shifted to that forum and consensus formed
about the<br>
currently<br>
&gt;&gt; &gt; proposed terms. It was within this group that the
additional terms<br>
&gt;&gt; &gt; (samplingGeometry, samplingUnit, eventSeriesID) were
proposed and where<br>
we<br>
&gt;&gt; &gt; began testing with sample data sets.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Best regards,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ?amonn<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *From:* <a moz-do-not-send="true"
 href="mailto:robgur@gmail.com" target="_blank">robgur@gmail.com</a>
[mailto:<a moz-do-not-send="true" href="mailto:robgur@gmail.com"
 target="_blank">robgur@gmail.com</a> &lt;<a moz-do-not-send="true"
 href="mailto:robgur@gmail.com" target="_blank">robgur@gmail.com</a>&gt;]<br>
*On<br>
&gt;&gt; &gt; Behalf Of *Robert Guralnick<br>
&gt;&gt; &gt; *Sent:* 19 August 2014 16:56<br>
&gt;&gt; &gt; *To:* ?amonn ? Tuama [GBIF]<br>
&gt;&gt; &gt; *Cc:* TDWG Content Mailing List<br>
&gt;&gt; &gt; *Subject:* Re: [tdwg-content] Darwin Core: proposed news
terms for<br>
&gt;&gt; &gt; expressing sample data<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;   Hi ?amonn --- I am curious about the outcomes presented
in the SIGS<br>
&gt;&gt; &gt; paper, in particular, this portion of the paper:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; "Solutions without introducing an event core in Darwin
Core Archives:<br>
&gt;&gt; &gt;  During the review of the solutions for the uses cases,
it became<br>
apparent<br>
&gt;&gt; &gt; that either model could be applied to every use case. The
core and<br>
&gt;&gt; &gt; extensions bore a complementary relationship and between
them could<br>
express<br>
&gt;&gt; &gt; all the required information. The core simply provided
the central<br>
anchor<br>
&gt;&gt; &gt; in the star schema from which to join the additional
information.<br>
&gt;&gt; &gt; Therefore, using the Occurrence core, well established in
the GBIF<br>
network<br>
&gt;&gt; &gt; through uptake of the IPT, seemed more appropriate than
inventing<br>
&gt;&gt; &gt; CollectingEvent as an additional core type."<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;    That SIGS paper has John Wieczorek and you both as
authors,<br>
including<br>
&gt;&gt; &gt; many luminaries across the biodiversity standards
spectrum.  Given the<br>
&gt;&gt; &gt; above, its curious to see the EventCore come back again,
along with a<br>
&gt;&gt; &gt; specific IPT version to support it.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;     So I see two issues, conflated, in this post you just
made.  One is<br>
&gt;&gt; &gt; the need for an EventCore at all, and the nature of
relating Event and<br>
&gt;&gt; &gt; Occurrence/Material Sample.  The second is the
introduction of new<br>
terms,<br>
&gt;&gt; &gt; which seemingly have arrived after debate on similar
terms - but framed<br>
&gt;&gt; &gt; around abundance - stalled a year ago.  To my mind, these
both require<br>
some<br>
&gt;&gt; &gt; further discussion, because I don't (necessarily) see
TDWG community<br>
&gt;&gt; &gt; coherence around either issue?<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Best, Rob<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; On Tue, Aug 19, 2014 at 6:11 AM, ?amonn ? Tuama [GBIF]<br>
&lt;<a moz-do-not-send="true" href="mailto:eotuama@gbif.org"
 target="_blank">eotuama@gbif.org</a>&gt;<br>
&gt;&gt; &gt; wrote:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Dear All,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; GBIF is committed to exploring ways in which the IPT and
Darwin Core<br>
&gt;&gt; &gt; Archive format can be extended for publishing
sample-based data sets.<br>
In<br>
&gt;&gt; &gt; association with the EU BON project [1], a customised
version of the<br>
IPT<br>
&gt;&gt; &gt; [2] has been deployed to test this using a special type
of Darwin Core<br>
&gt;&gt; &gt; Archive in which the core is an ?Event? with associated
taxon<br>
occurrences<br>
&gt;&gt; &gt; in an ?Occurrence? extension.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; The Darwin Core vocabulary already provides a rich set of
terms with<br>
many<br>
&gt;&gt; &gt; relevant for describing sample-based data. Synthesising
several sources<br>
of<br>
&gt;&gt; &gt; input (GBIF organised workshop on sample data, May 2013
[3],<br>
discussions on<br>
&gt;&gt; &gt; the TDWG mailing list in late 2013; internal discussion
among EU BON<br>
&gt;&gt; &gt; project partners), five new terms relating to sample data
were<br>
identified<br>
&gt;&gt; &gt; as essential. The complete model including these new
terms are fully<br>
&gt;&gt; &gt; described with examples in the online document
?Publishing sample data<br>
&gt;&gt; &gt; using the GBIF IPT? [4].<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; As a first step towards ratification, we would like to
register the new<br>
&gt;&gt; &gt; terms in the DwC Google Code tracker [5] if there are no
major<br>
objections<br>
&gt;&gt; &gt; on this list. The five terms are:<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 1.      *quantity*: the number or enumeration value of
the quantityType<br>
&gt;&gt; &gt; (e.g., individuals, biomass, biovolume,
BraunBlanquetScale) per<br>
&gt;&gt; &gt; samplingUnit or a percentage measure recorded for the
sample.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 2.      *quantityType*: :  the entity being referred to
by quantity,<br>
&gt;&gt; &gt; e.g., individuals, biomass, %species, scale type.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 3.      *samplingGeometry*: an indication of what kind of
space was<br>
&gt;&gt; &gt; sampled; select from point, line, area or volume.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 4.      *samplingUnit*: the unit of measurement used for
reporting the<br>
&gt;&gt; &gt; quantity in the sample, e.g., minute, hour, day, metre,
metre^2,<br>
metre^3.<br>
&gt;&gt; &gt; It is combined with quantity and quantityType to provide
the complete<br>
&gt;&gt; &gt; measurement, e.g., 9 individuals per day,  4 biomass-gm
per metre^2.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; 5.      *eventSeriesID*: an identifier for a set of
events that are<br>
&gt;&gt; &gt; associated in some way, e.g., a monitoring series; may be
a global<br>
unique<br>
&gt;&gt; &gt; identifier or an identifier specific to the series.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Best regards,<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ?amonn<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [1] <a moz-do-not-send="true" href="http://eubon.eu"
 target="_blank">http://eubon.eu</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [2] <a moz-do-not-send="true"
 href="http://eubon-ipt.gbif.org" target="_blank">http://eubon-ipt.gbif.org</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [3]<br>
&gt;&gt; &gt;<br>
  <a moz-do-not-send="true"
 href="http://www.standardsingenomics.org/index.php/sigen/article/view/sigs.4898640"
 target="_blank">http://www.standardsingenomics.org/index.php/sigen/article/view/sigs.4898640</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [4] <a moz-do-not-send="true"
 href="http://links.gbif.org/sample_data_model" target="_blank">http://links.gbif.org/sample_data_model</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; [5] <a moz-do-not-send="true"
 href="https://code.google.com/p/darwincore/issues/list" target="_blank">https://code.google.com/p/darwincore/issues/list</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; ____________________________________________________<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *?amonn ? Tuama, M.Sc., Ph.D. (<a moz-do-not-send="true"
 href="mailto:eotuama@gbif.org" target="_blank">eotuama@gbif.org</a>
&lt;<a moz-do-not-send="true" href="mailto:eotuama@gbif.org"
 target="_blank">eotuama@gbif.org</a>&gt;), *<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *Senior Programme Officer for Interoperability, *<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *Global Biodiversity Information Facility Secretariat, *<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *Universitetsparken 15, DK-2100, Copenhagen ?, DENMARK*<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; *Phone:  <a moz-do-not-send="true"
 href="tel:%2B45%203532%201494" target="_blank">+45 3532 1494</a>
&lt;%2B45%203532%201494&gt;; Fax:  <a moz-do-not-send="true"
 href="tel:%2B45%203532%201480" target="_blank">+45 3532 1480</a><br>
&gt;&gt; &gt; &lt;%2B45%203532%201480&gt;*<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; tdwg-content mailing list<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; tdwg-content mailing list<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; --<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Anne E. Thessen, Ph.D.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; The Data Detektiv, Owner and Founder<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Ronin Institute, Research Scholar<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; <a moz-do-not-send="true" href="tel:443.225.9185"
 target="_blank">443.225.9185</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; tdwg-content mailing list<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; --<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Anne E. Thessen, Ph.D.<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; The Data Detektiv, Owner and Founder<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; Ronin Institute, Research Scholar<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; <a moz-do-not-send="true" href="tel:443.225.9185"
 target="_blank">443.225.9185</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; tdwg-content mailing list<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt; _______________________________________________<br>
&gt;&gt; &gt; tdwg-content mailing list<br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; &gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt; &gt;<br>
&gt;&gt; &gt;<br>
&gt;&gt; -------------- next part --------------<br>
&gt;&gt; An HTML attachment was scrubbed...<br>
&gt;&gt; URL:<br>
  <a moz-do-not-send="true"
 href="http://lists.tdwg.org/pipermail/tdwg-content/attachments/20140821/4b338606/attachment-0001.html"
 target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/attachments/20140821/4b338606/a<br>
ttachment-0001.html</a><br>
&gt;&gt;<br>
&gt;&gt; ------------------------------<br>
&gt;&gt;<br>
&gt;&gt; Message: 2<br>
&gt;&gt; Date: Fri, 22 Aug 2014 08:54:07 +0200<br>
&gt;&gt; From: "Donald Hobern [GBIF]" &lt;<a moz-do-not-send="true"
 href="mailto:dhobern@gbif.org" target="_blank">dhobern@gbif.org</a>&gt;<br>
&gt;&gt; Subject: Re: [tdwg-content] Darwin Core: proposed news terms
for<br>
&gt;&gt;         expressing      sample data<br>
&gt;&gt; To: "'Matt Jones'" &lt;<a moz-do-not-send="true"
 href="mailto:jones@nceas.ucsb.edu" target="_blank">jones@nceas.ucsb.edu</a>&gt;,
'?amonn ? Tuama [GBIF]'<br>
&gt;&gt;         &lt;<a moz-do-not-send="true"
 href="mailto:eotuama@gbif.org" target="_blank">eotuama@gbif.org</a>&gt;<br>
&gt;&gt; Cc: 'TDWG Content Mailing List' &lt;<a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a>&gt;<br>
&gt;&gt; Message-ID: &lt;003401cfbdd5$de52b640$9af822c0$@<a
 moz-do-not-send="true" href="http://gbif.org" target="_blank">gbif.org</a>&gt;<br>
&gt;&gt; Content-Type: text/plain; charset="utf-8"<br>
&gt;&gt;<br>
&gt;&gt; Hi Matt,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I?ll take the chance to make a few quick comments here,
because I believe<br>
that this work is of massive importance.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Clearly DwC should avoid trying to duplicate well-standardised
models and<br>
protocols.  However at the same time, there is enormous value for
producers<br>
and consumers of DwC to benefit from richer data on the events and
methods<br>
associated with individual species occurrences.  I have never seen DwC
as<br>
purely an Occurrence exchange syntax.  I see it (from GBIF?s standpoint)<br>
more closely as a mechanism for diverse parties to pool the evidence
they<br>
have for the occurrence of any species including associated information<br>
and/or actionable links to associated information.  Users coming from
this<br>
perspective certainly need (and are demanding) access to all the
evidence<br>
that can be mobilized to serve as supporting evidence and they also
need the<br>
ability to understand the significance of these records.  Abundance<br>
measures, levels of effort, use of consistent methods and redetection of<br>
individual organisms are all part of this.  DwC should be able to
transmit<br>
as much data as publishers cho<br>
&gt;&gt;  ose to share on such aspects as part of their publishing of
DwC.  Users<br>
of DwC carrying out species modeling, threat assessment or community<br>
analyses will benefit from rapid ways to filter data for those which
derive<br>
from standardized sampling events, to understand relative abundance
within<br>
samples, etc.  Many publishers of DwC are currently sharing
stripped-down<br>
subsets of data and wish to give more information on these points. 
Users<br>
are certainly demanding it.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; The challenge is finding the sweet spot, the achievable,
non-destructive<br>
overlap between DwC and the proper domain of models better designed to<br>
handle the representation of complex systems outside DwC?s current
domain.<br>
If this is done correctly, there should be paths that enable us to
generate<br>
O&amp;E (and maybe OBOE) compatible data from data that publishers only
serve as<br>
augmented DwC.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I?ll also note that this has been a prominent area of
discussion now for<br>
several years.  Many of us believe strongly that this is one of the most<br>
important ways in which we need to close arbitrary gaps between data
silos.<br>
It?s a prominent part of the GBIF work programme for 2014-2016.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Very best wishes,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Donald<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; From: <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a><br>
[mailto:<a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>]
On Behalf Of Matt Jones<br>
&gt;&gt; Sent: Friday, August 22, 2014 4:52 AM<br>
&gt;&gt; To: ?amonn ? Tuama [GBIF]<br>
&gt;&gt; Cc: TDWG Content Mailing List<br>
&gt;&gt; Subject: Re: [tdwg-content] Darwin Core: proposed news terms
for<br>
expressing sample data<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; This proposal is treading on ground that is quite similar to
other<br>
observations and measurements standards for data exchange that are
already<br>
mature, in particular:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; * OGC Observations and Measurements<br>
(<a moz-do-not-send="true"
 href="http://www.opengeospatial.org/standards/om" target="_blank">http://www.opengeospatial.org/standards/om</a>)<br>
&gt;&gt;<br>
&gt;&gt; * Extensible Observation Ontology (OBOE;<br>
  <a moz-do-not-send="true"
 href="https://semtools.ecoinformatics.org/oboe" target="_blank">https://semtools.ecoinformatics.org/oboe</a>)<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; The former is a standard and broadly deployed, whereas the
latter is part<br>
of a research program in the use of ontologies for measurements. 
Through<br>
collaboration between the two projects, they've been modified to be<br>
reasonably isomorphic, but O&amp;M uses an XML serialization while OBOE
uses an<br>
OWL-DL serialization. They largely express the same measurements and<br>
sampling model once one gets beyond the terminology differences.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; So, I'm wondering if it make much sense to extend Darwin Core,
which is<br>
at heart an Occurrence exchange syntax, into this measurements area
that is<br>
well represented by these other existing specifications?  I'm curious to<br>
hear why people would even want to do this.  And if we do go down this
path,<br>
won't we just end up with a new syntax that does essentially what
O&amp;M and<br>
OBOE do now?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Matt<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Thu, Aug 21, 2014 at 12:22 AM, ?amonn ? Tuama [GBIF]<br>
&lt;<a moz-do-not-send="true" href="mailto:eotuama@gbif.org"
 target="_blank">eotuama@gbif.org</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Rob, Anne, Rich,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I think Markus has answered your question as to why we opted
for an Event<br>
core which is being used in the sense described by Anne and Rich. For
any<br>
event, you can have a list of species in an Occurrence extension and for<br>
each species, you can include quantity and quantityType, e.g., biomass,
etc.<br>
The proposed term eventSeriesID was intended for linking together
related<br>
events, although it now looks like parentEventID might be a better, more<br>
flexible term. The measurementOrFact extension is a good fit for
capturing<br>
environmental information relating to an event. See, e.g., the Gialova<br>
Lagoon brackish water invertebrate test data set [1] where a set of 18<br>
environmental variables, including temp, pH, Rdx, particulate organic<br>
matter, dissolved oxygen, salinity, chlorophyll-a were measured for each<br>
sampling station-sampling period combination. An example mapping is:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Id            measurementType           measurementValue<br>
measurementUnit               measurementRemarks<br>
&gt;&gt;<br>
&gt;&gt; IA           Tmp (sed)                           21.5<br>
degree C                             Tmp (sed): temperature at the
bottom<br>
surface<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; *Controlled vocabularies*<br>
&gt;&gt;<br>
&gt;&gt; Ideally, the values for samplingUnit and quantityType would be
selected<br>
from controlled vocabularies. This is, effectively, what we do by
presenting<br>
a small list of values in a drop-down menu. The current values are what
we<br>
derived for example data sets and discussion but they can undoubtedly be<br>
extended and improved.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; We capture ?bucket? type measures through a combination of<br>
samplingEffort, samplingGeometry and samplingUnit. For example, a
pitfall<br>
trap (in a point location) left out for 16 days might have
samplingEffort:<br>
16, samplingGeometry: point and samplingUnit: day. Three m^2 quadrats
in a<br>
shore survey might have samplingEffort: 3, samplingGeometry: area and<br>
samplingUnit: m^2.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; It would be very useful to see your compilation of scope,
effort and<br>
completeness measures to see if we can express them in our model and/or
if<br>
we need to reconsider our approach.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; ?amonn<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; [1] <a moz-do-not-send="true"
 href="http://eubon-ipt.gbif.org/resource.do?r=ionian-brackish-lagoon"
 target="_blank">http://eubon-ipt.gbif.org/resource.do?r=ionian-brackish-lagoon</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; From: <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a><br>
[mailto:<a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>]
On Behalf Of Markus D?ring<br>
&gt;&gt; Sent: 20 August 2014 23:47<br>
&gt;&gt; To: Robert Guralnick<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Cc: TDWG Content Mailing List<br>
&gt;&gt; Subject: Re: [tdwg-content] Darwin Core: proposed news terms
for<br>
expressing sample data<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Rob,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; this proposal if for monitoring surveys really, not to be
confused with<br>
material samples like environmental or tissue samples which have a
distinct<br>
new dwc class MaterialSample.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; We tend to overload the term sampling a lot and it helps
treating<br>
material samples different from pure observational "sampling". That is
why<br>
the existing Event class was used as the core and classic Occurrence
records<br>
as extensions. A classic example is a vegetation survey where each plot<br>
represents an Event record and each recorded species in that plot will
be an<br>
Occurrence extension record with a given quantity. Darwin Core already<br>
offers individualCount to specify quantity, but it is a very specific
way of<br>
measuring "abundance" restricted to only some use cases. Abiotic<br>
measurements about the plot (e.g. soil type, pH, temperature) can be<br>
published using the measurements or facts extension linked to the Event<br>
core.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Markus<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On 20 Aug 2014, at 20:08, Robert Guralnick<br>
&lt;<a moz-do-not-send="true"
 href="mailto:Robert.Guralnick@colorado.edu" target="_blank">Robert.Guralnick@colorado.edu</a>&gt;
wrote:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;   Anne -- I don't know the answers!  These are questions for
Eamonn.  I<br>
would presume that a sample could be a jumble of species or even just
water<br>
or soil samples, and biomass would refer to that sample - but maybe that<br>
isn't a use case being considered?  The examples given in the longer<br>
document all link an event_id to species name and some measure of
quantity<br>
for that species (to the species, not an individual specimen), so I
assume<br>
that is the prevailing (or only) case?<br>
&gt;&gt;<br>
&gt;&gt; Best, Rob<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Wed, Aug 20, 2014 at 11:56 AM, Anne Thessen &lt;<a
 moz-do-not-send="true" href="mailto:annethessen@gmail.com"
 target="_blank">annethessen@gmail.com</a>&gt;<br>
wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Rob<br>
&gt;&gt; I would like to respond to your item number 2.<br>
&gt;&gt; &gt;From my perspective, I deal with lots of published
descriptions of taxa.<br>
The text might say something like "I saw species A in the Chesapeake
Bay,<br>
the Adriatic Sea and the Indian Ocean and the biomass is 5 - 9 grams".
The<br>
biomass range obviously corresponds to at least three different
occurrences,<br>
but how to divide the biomass data? I would love to be able to have an<br>
*event* to attach it all to. There is almost two different levels of
events<br>
- a sampling event and a "study event". The "study event" would
correspond<br>
to the type of event I would like to use in the above example. It may
not be<br>
ideal, but for the old literature that might be the best we can do.<br>
&gt;&gt; I have to admit that I don't know enough about trawl data to
understand<br>
why an event core would be a problem. It seems that the trawl would be
an<br>
event and each biomass measure (of each fish) would be attached to a<br>
separate occurrence which is attached to that event. Am I understanding
this<br>
wrong?<br>
&gt;&gt; btw - I found a workaround for the example I gave, so it's not
impossible<br>
to model with the current structure....<br>
&gt;&gt; Anne<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On 8/20/2014 1:16 PM, Robert Guralnick wrote:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; ?amonn et al. --- Thanks for the clarifications.  I think
these help a<br>
ton but it raises a couple more questions for me.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 1)   I am surprised that you plan to use of MeasurementorFact
extension<br>
in relation to the Event core, which seems like a novel (or perhaps
awkward<br>
or unintended?) mechanism for capturing environmental data, but the same<br>
extension was not be seen as relevant for describing samples? Can you<br>
explain more about the thinking there?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 2)  There may be a subtle issue here extending "Event" to be
more what<br>
you call a "Sampling Event Core".  My read of this is that Darwin Core<br>
serves as a way to deal with point occurrences and Event reflects the<br>
context of a single capture event (whether a single observation, or a
bulk<br>
sample capture).  The changes recommended seem to dramatically extend
and<br>
change that meaning?  Its simply a question that I don't have answer
to, but<br>
is Darwin Core, the right vehicle to start capturing repeated measures
of<br>
biomass values from trawls?   I don't have answer but man, terms like<br>
quantityType (as a property of occurrence?) give me pause.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 3)  Is Sampling Unit a controlled vocabulary? For another
project, I have<br>
looked through - and captured scope, effort and completeness measures
from -<br>
a large number of published biotic area inventories.  The vast
majorities of<br>
these are measured in units like bucket hours, or trap nights.  Is a<br>
"bucket" part of SamplingGeometry or Sampling Unit?  I'd be happy to
send<br>
along all the many examples of how biotic inventories of an area are<br>
completed and perhaps it might be good to see how those might be
represented<br>
using the terms you are proposing?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Best, Rob<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Wed, Aug 20, 2014 at 10:16 AM, Richard Pyle<br>
&lt;<a moz-do-not-send="true" href="mailto:deepreef@bishopmuseum.org"
 target="_blank">deepreef@bishopmuseum.org</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Same here ? Events are central to the work that we do.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Aloha,<br>
&gt;&gt;<br>
&gt;&gt; Rich<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; From: <a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a><br>
[mailto:<a moz-do-not-send="true"
 href="mailto:tdwg-content-bounces@lists.tdwg.org" target="_blank">tdwg-content-bounces@lists.tdwg.org</a>]
On Behalf Of Anne Thessen<br>
&gt;&gt; Sent: Wednesday, August 20, 2014 2:59 AM<br>
&gt;&gt; To: <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Subject: Re: [tdwg-content] Darwin Core: proposed news terms
for<br>
expressing sample data<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Hello<br>
&gt;&gt; I would just like to comment on *event core*.<br>
&gt;&gt; I've been doing a lot of work translating published data into
Darwin<br>
Core. During that process I've wished several times that I could use
Event<br>
as core. I am happy to hear about that proposed change. It will make it<br>
easier to model the data I am working with.<br>
&gt;&gt; Anne<br>
&gt;&gt;<br>
&gt;&gt; On 8/20/2014 7:04 AM, ?amonn ? Tuama [GBIF] wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Rob,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Thank you for the feedback. I have tried to address the two
main issues<br>
you raise below. At the outset, I would like to emphasise that much of
this<br>
work is taking place in the context of the EU BON project which
includes a<br>
task on developing/enhancing tools and standards for data sharing with a<br>
particular focus on the IPT for publishing sample-based data. So, we
were<br>
constrained by the need to publish sample-based data sets in the Darwin
Core<br>
Archive format and to demonstrate practical application using a working<br>
prototype. When the discussion on the TDWG list faded out, we took it
to our<br>
EU BON partners whose requirements were essential input to further<br>
development. We recognise that these discussions took place away from
TDWG<br>
(although the TDWG/EU BON contributors overlapped) and this is the
reason we<br>
are presenting  the outcomes here for further consideration.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; *Event core*<br>
&gt;&gt;<br>
&gt;&gt; As the SIGS report indicated, sample data can be modelled in
Darwin Core<br>
Archives using either Occurrence or Event as core. This was the starting<br>
point for our evaluation but as things progressed the data wrangling
pushed<br>
the model back towards the Event core. We actually went through the
exercise<br>
of mapping multiple test datasets in an iterative process spanning
several<br>
months' work. In the end, we found that using an Event core better
matched<br>
the typical sample data we were dealing with, allowing use of a<br>
measurement-or-fact extension to be included for the efficient
expression of<br>
environmental information associated with the event. The choice comes
down<br>
to an Occurrence core or an Event core + Occurrence extension. In both<br>
cases, the true observation records are Occurrences. The big difference
is<br>
what type the core has and therefore to which kind of records you can
attach<br>
further facts and extra information with DwC-A extensions. Many sampling<br>
datasets have very rich infor<br>
&gt;&gt;  mation about the site and event, so it is very natural to
hang facts<br>
from an Event core. When picking the Occurrence core those facts would
have<br>
to be repeated for each and every occurrence record. Moreover, our
approach<br>
doesn?t stop anyone from using the Occurrence core if they so wish. This<br>
just provides a different option for datasets that better fit an Event
core<br>
model.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I want to stress that we are not building a ?specific IPT
version? to<br>
support an Event core but, rather, we adapted the IPT so that it can be<br>
configured to support any generic ?core + extension? format to enable
its<br>
use for exploration of more data formats.  This is part of the core
codebase<br>
and there were no custom forks of the IPT for this work.  Our view at
GBIF<br>
is that if there are significant numbers of data publishers who are
keen to<br>
adopt, promote and use a (any) format, and the tools can be configured
to do<br>
so, then we should support it, and, if necessary, use a custom
namespace.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; *New terms around abundance*<br>
&gt;&gt;<br>
&gt;&gt; Yes, the discussion on TDWG did fade out but it was clear that
the term<br>
?abundance?  as recommended by the SIGS report (along with<br>
abundanceAsPercent) was confusing many when we were looking for term(s)
that<br>
reported quantitative measures of organisms in a sample. It also became<br>
clear we would need to be able to state the type of quantity being
measured.<br>
An alternative suggestion for using the MeasurementsOrFact class was<br>
immediately shot down.<br>
&gt;&gt;<br>
&gt;&gt; As some of our main use cases were coming from the EU BON
project,<br>
discussion shifted to that forum and consensus formed about the
currently<br>
proposed terms. It was within this group that the additional terms<br>
(samplingGeometry, samplingUnit, eventSeriesID) were proposed and where
we<br>
began testing with sample data sets.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Best regards,<br>
&gt;&gt;<br>
&gt;&gt; ?amonn<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; From: <a moz-do-not-send="true" href="mailto:robgur@gmail.com"
 target="_blank">robgur@gmail.com</a> [mailto:<a moz-do-not-send="true"
 href="mailto:robgur@gmail.com" target="_blank">robgur@gmail.com</a>]
On Behalf Of Robert<br>
Guralnick<br>
&gt;&gt; Sent: 19 August 2014 16:56<br>
&gt;&gt; To: ?amonn ? Tuama [GBIF]<br>
&gt;&gt; Cc: TDWG Content Mailing List<br>
&gt;&gt; Subject: Re: [tdwg-content] Darwin Core: proposed news terms
for<br>
expressing sample data<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;   Hi ?amonn --- I am curious about the outcomes presented in
the SIGS<br>
paper, in particular, this portion of the paper:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; "Solutions without introducing an event core in Darwin Core
Archives:<br>
During the review of the solutions for the uses cases, it became
apparent<br>
that either model could be applied to every use case. The core and<br>
extensions bore a complementary relationship and between them could
express<br>
all the required information. The core simply provided the central
anchor in<br>
the star schema from which to join the additional information.
Therefore,<br>
using the Occurrence core, well established in the GBIF network through<br>
uptake of the IPT, seemed more appropriate than inventing
CollectingEvent as<br>
an additional core type."<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;    That SIGS paper has John Wieczorek and you both as authors,
including<br>
many luminaries across the biodiversity standards spectrum.  Given the<br>
above, its curious to see the EventCore come back again, along with a<br>
specific IPT version to support it.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;     So I see two issues, conflated, in this post you just
made.  One is<br>
the need for an EventCore at all, and the nature of relating Event and<br>
Occurrence/Material Sample.  The second is the introduction of new
terms,<br>
which seemingly have arrived after debate on similar terms - but framed<br>
around abundance - stalled a year ago.  To my mind, these both require
some<br>
further discussion, because I don't (necessarily) see TDWG community<br>
coherence around either issue?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Best, Rob<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Tue, Aug 19, 2014 at 6:11 AM, ?amonn ? Tuama [GBIF] &lt;<a
 moz-do-not-send="true" href="mailto:eotuama@gbif.org" target="_blank">eotuama@gbif.org</a>&gt;<br>
wrote:<br>
&gt;&gt;<br>
&gt;&gt; Dear All,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; GBIF is committed to exploring ways in which the IPT and
Darwin Core<br>
Archive format can be extended for publishing sample-based data sets. In<br>
association with the EU BON project [1], a customised version of the
IPT [2]<br>
has been deployed to test this using a special type of Darwin Core
Archive<br>
in which the core is an ?Event? with associated taxon occurrences in an<br>
?Occurrence? extension.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; The Darwin Core vocabulary already provides a rich set of
terms with many<br>
relevant for describing sample-based data. Synthesising several sources
of<br>
input (GBIF organised workshop on sample data, May 2013 [3],
discussions on<br>
the TDWG mailing list in late 2013; internal discussion among EU BON
project<br>
partners), five new terms relating to sample data were identified as<br>
essential. The complete model including these new terms are fully
described<br>
with examples in the online document ?Publishing sample data using the
GBIF<br>
IPT? [4].<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; As a first step towards ratification, we would like to
register the new<br>
terms in the DwC Google Code tracker [5] if there are no major
objections on<br>
this list. The five terms are:<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 1.      quantity: the number or enumeration value of the
quantityType<br>
(e.g., individuals, biomass, biovolume, BraunBlanquetScale) per
samplingUnit<br>
or a percentage measure recorded for the sample.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 2.      quantityType: :  the entity being referred to by
quantity, e.g.,<br>
individuals, biomass, %species, scale type.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 3.      samplingGeometry: an indication of what kind of space
was<br>
sampled; select from point, line, area or volume.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 4.      samplingUnit: the unit of measurement used for
reporting the<br>
quantity in the sample, e.g., minute, hour, day, metre, metre^2,
metre^3.<br>
It is combined with quantity and quantityType to provide the complete<br>
measurement, e.g., 9 individuals per day,  4 biomass-gm per metre^2.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; 5.      eventSeriesID: an identifier for a set of events that
are<br>
associated in some way, e.g., a monitoring series; may be a global
unique<br>
identifier or an identifier specific to the series.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Best regards,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; ?amonn<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; [1] <a moz-do-not-send="true" href="http://eubon.eu"
 target="_blank">http://eubon.eu</a> &lt;<a moz-do-not-send="true"
 href="http://eubon.eu/" target="_blank">http://eubon.eu/</a>&gt;<br>
&gt;&gt;<br>
&gt;&gt; [2] <a moz-do-not-send="true" href="http://eubon-ipt.gbif.org"
 target="_blank">http://eubon-ipt.gbif.org</a> &lt;<a
 moz-do-not-send="true" href="http://eubon-ipt.gbif.org/"
 target="_blank">http://eubon-ipt.gbif.org/</a>&gt;<br>
&gt;&gt;<br>
&gt;&gt; [3]<br>
  <a moz-do-not-send="true"
 href="http://www.standardsingenomics.org/index.php/sigen/article/view/sigs.4898640"
 target="_blank">http://www.standardsingenomics.org/index.php/sigen/article/view/sigs.4898640</a><br>
&gt;&gt;<br>
&gt;&gt; [4]  &lt;<a moz-do-not-send="true"
 href="http://links.gbif.org/sample_data_model" target="_blank">http://links.gbif.org/sample_data_model</a>&gt;<br>
  <a moz-do-not-send="true"
 href="http://links.gbif.org/sample_data_model" target="_blank">http://links.gbif.org/sample_data_model</a><br>
&gt;&gt;<br>
&gt;&gt; [5] <a moz-do-not-send="true"
 href="https://code.google.com/p/darwincore/issues/list" target="_blank">https://code.google.com/p/darwincore/issues/list</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; ____________________________________________________<br>
&gt;&gt;<br>
&gt;&gt; ?amonn ? Tuama, M.Sc., Ph.D. (<a moz-do-not-send="true"
 href="mailto:eotuama@gbif.org" target="_blank">eotuama@gbif.org</a>),<br>
&gt;&gt;<br>
&gt;&gt; Senior Programme Officer for Interoperability,<br>
&gt;&gt;<br>
&gt;&gt; Global Biodiversity Information Facility Secretariat,<br>
&gt;&gt;<br>
&gt;&gt; Universitetsparken 15, DK-2100, Copenhagen ?, DENMARK<br>
&gt;&gt;<br>
&gt;&gt; Phone:  <a moz-do-not-send="true"
 href="tel:%2B45%203532%201494" target="_blank">+45 3532 1494</a> &lt;<a
 moz-do-not-send="true" href="tel:%2B45%203532%201494">tel:%2B45%203532%201494</a>&gt;
; Fax:  <a moz-do-not-send="true" href="tel:%2B45%203532%201480"
 target="_blank">+45 3532 1480</a><br>
&lt;<a moz-do-not-send="true" href="tel:%2B45%203532%201480">tel:%2B45%203532%201480</a>&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt;<br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Anne E. Thessen, Ph.D.<br>
&gt;&gt; The Data Detektiv, Owner and Founder<br>
&gt;&gt; Ronin Institute, Research Scholar<br>
&gt;&gt; <a moz-do-not-send="true" href="tel:443.225.9185"
 target="_blank">443.225.9185</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Anne E. Thessen, Ph.D.<br>
&gt;&gt; The Data Detektiv, Owner and Founder<br>
&gt;&gt; Ronin Institute, Research Scholar<br>
&gt;&gt; <a moz-do-not-send="true" href="tel:443.225.9185"
 target="_blank">443.225.9185</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; -------------- next part --------------<br>
&gt;&gt; An HTML attachment was scrubbed...<br>
&gt;&gt; URL:<br>
  <a moz-do-not-send="true"
 href="http://lists.tdwg.org/pipermail/tdwg-content/attachments/20140822/a46f067d/attachment-0001.html"
 target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/attachments/20140822/a46f067d/a<br>
ttachment-0001.html</a><br>
&gt;&gt;<br>
&gt;&gt; ------------------------------<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; End of tdwg-content Digest, Vol 63, Issue 6<br>
&gt;&gt; *******************************************<br>
&gt;&gt;<br>
&gt;&gt; _______________________________________________<br>
&gt;&gt; tdwg-content mailing list<br>
&gt;&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt;&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; tdwg-content mailing list<br>
&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; _______________________________________________<br>
&gt; tdwg-content mailing list<br>
&gt; <a moz-do-not-send="true"
 href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
&gt; <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
  <br>
  <br>
  <br>
_______________________________________________<br>
tdwg-content mailing list<br>
  <a moz-do-not-send="true" href="mailto:tdwg-content@lists.tdwg.org"
 target="_blank">tdwg-content@lists.tdwg.org</a><br>
  <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
  <br>
  <br>
_______________________________________________<br>
tdwg-content mailing list<br>
  <a moz-do-not-send="true" href="mailto:tdwg-content@lists.tdwg.org"
 target="_blank">tdwg-content@lists.tdwg.org</a><br>
  <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><o:p></o:p></p>
  </div>
  </div>
  </div>
  <p class="MsoNormal"><br>
  <br clear="all">
  <o:p></o:p></p>
  <div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  </div>
  </div>
  <p class="MsoNormal"><span class="hoenzb"><span
 style="color: rgb(136, 136, 136);">-- </span></span><span
 style="color: rgb(136, 136, 136);"><br>
  <span class="hoenzb">John Deck</span><br>
  <span class="hoenzb"><a moz-do-not-send="true"
 href="tel:%28541%29%20321-0689" target="_blank">(541) 321-0689</a></span></span><o:p></o:p></p>
  </div>
  </div>
  <p class="MsoNormal" style="margin-bottom: 12pt;"><br>
_______________________________________________<br>
tdwg-content mailing list<br>
  <a moz-do-not-send="true" href="mailto:tdwg-content@lists.tdwg.org">tdwg-content@lists.tdwg.org</a><br>
  <a moz-do-not-send="true"
 href="http://lists.tdwg.org/mailman/listinfo/tdwg-content"
 target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><o:p></o:p></p>
  </div>
  <p class="MsoNormal"><o:p> </o:p></p>
  </div>
  </div>
</blockquote>
<br>
<pre class="moz-signature" cols="72">-- 
Steven J. Baskauf, Ph.D., Senior Lecturer
Vanderbilt University Dept. of Biological Sciences

postal mail address:
PMB 351634
Nashville, TN  37235-1634,  U.S.A.

delivery address:
2125 Stevenson Center
1161 21st Ave., S.
Nashville, TN 37235

office: 2128 Stevenson Center
phone: (615) 343-4582,  fax: (615) 322-4942
If you fax, please phone or email so that I will know to look for it.
<a class="moz-txt-link-freetext" href="http://bioimages.vanderbilt.edu">http://bioimages.vanderbilt.edu</a>
<a class="moz-txt-link-freetext" href="http://vanderbilt.edu/trees">http://vanderbilt.edu/trees</a>

</pre>
</body>
</html>