Hi Matt,<div><br></div><div>It took me a while to ponder your question. There is a long answer which complex and easily misinterpreted and there is a shorter answer.</div><div><br></div><div>For now I think the &quot;shorter&quot; answer set in a historical context is best.</div>



<div><br></div><div>The best use of my abilities seems to be recognizing a &quot;ability gap&quot; and figuring out a technical solution or tool to address it.</div><div><br></div><div>The most visible of these were involving microscopy and visualization tools to make complex ideas understandable.</div>



<div><br></div><div>My interest in the species problem dates back to when I had the opportunity to talk with E.O. WIlson in 1991/1992. </div><div><br></div><div>At that time he said that if you have a knack for computers we need all this information in databases so it is accessible.</div>



<div><br></div><div>*One of his former Ph.D. students is on my committee.</div><div><br></div><div>Years later I had the opportunity to work on questions like this and started to think about how to connect all these disparate facts about species together in a usable queryable knowledge base.</div>



<div><br></div><div>I noticed that several groups and individuals were marking up data sets including observations with different scientific names even though they were clearly meaning the same &quot;species&quot;.</div>



<div><br></div><div>* These groups would agree that they were communicating about the same species, but not always agree on the name</div><div><br></div><div>This prevents large scale data integration and analysis which in part is described here: <a href="http://about.geospecies.org/" target="_blank">http://about.geospecies.org/</a></div>



<div><br></div><div>With the advent of the web, and the the semantic web in particular, this &quot;database&quot; could be global and almost infinitely scalable.</div><div><br></div><div><a href="http://about.geospecies.org/" target="_blank"></a>I started lobbying TDWG starting in 2006 for two things:</div>



<div><br></div><div>1) A GUID for the &quot;species&quot; that was not tied to a particular name string</div><div>2) A system that followed semantic web best practices which LSID etc. do not.</div><div><br></div><div>Since my TDWG efforts were not successful, I started GeoSpecies and based on comments from a semantic web expert modified these somewhat into what is now TaxonConcept.org</div>



<div><br></div><div>The TCS is an xml standard for transmitting information about a taxon concepts that I think maps best to a &quot;name use concept.&quot; (Rich&#39;s TNU&#39;s)</div><div><br></div><div>The TaxonConcepts are identified with semantic web GUIDs that follow semantic web best practices and resolve to an informative documents.</div>



<div><br></div><div>In their current form these documents are not ideal because they do not do a good enough job clearing up what would be the best concept match for a given individual or specimen.</div><div><br></div><div>



They do however have most of the plumbing for this in that they allow semantic web links to name uses, specimens, occurrence records, images, DNA, authors and publications including the original description.</div>
<div><br></div><div>They also link to similar entities that are on the semantic web, most notably DBpedia, Uniprot, Freebase, Bio2RDF etc. </div><div><br></div><div>This linking may not seem valuable to a humans, is valuable for machines that need to determine what entities are similar and what entities are different.</div>



<div><br></div><div>This also increases the &quot;findability&quot; of these other data sets.</div><div><br></div><div>I see my current set of about 105,000 species as an example set that people can use to try out these models.</div>



<div><br></div><div>In their final form these should be authored by editors that determine what specimens and other data are good examples of instances of these concepts.</div><div><br></div><div>The editors will be linked via a URI so it is easy to track attribution.</div>



<div><br></div><div>The final concepts do not have to be in one place, they could be distributed but to avoid the kinds of nomenclatural differences that have occurred between zoology / botany etc it would be best to have one code base for now.</div>



<div><br></div><div>They don&#39;t have to have the same underlying stack, which now is based on Ruby on Rails, but could be ported to anything.</div><div><br></div><div>What they do need is a common structure and a common understanding as to what each attribute means and how it can be appropriately used.</div>



<div><br></div><div>For some use cases it is appropriate to consider the following the same &quot;thing&quot;</div><div><br></div><div> <a href="http://lod.taxonconcept.org/ses/v6n7p#Species" target="_blank">http://lod.taxonconcept.org/ses/v6n7p#Species</a> </div>



<div><br></div><div> <a href="http://purl.uniprot.org/taxonomy/9696" target="_blank">http://purl.uniprot.org/taxonomy/9696</a></div><div><br></div><div><a href="http://purl.uniprot.org/taxonomy/9696" target="_blank"></a> <a href="http://www.freebase.com/view/en/cougar" target="_blank">http://www.freebase.com/view/en/cougar</a></div>



<div><br></div><div><a href="http://www.freebase.com/view/en/cougar" target="_blank"></a><a href="http://sw.opencyc.org/concept/Mx4rvVj5o5wpEbGdrcN5Y29ycA" target="_blank">http://sw.opencyc.org/concept/Mx4rvVj5o5wpEbGdrcN5Y29ycA</a></div>


<div><br></div>
<div><a href="http://sw.opencyc.org/concept/Mx4rvVj5o5wpEbGdrcN5Y29ycA" target="_blank"></a><a href="http://www.bbc.co.uk/nature/species/Cougar#species" target="_blank">http://www.bbc.co.uk/nature/species/Cougar#species</a><br>


<br></div><div>For other use cases, this sameAs is not appropriate.</div>
<div><br></div><div>Wikipedia is very valuable, but if someone changes the article title then the URI changes in DBpedia.</div><div><br></div><div>Uniprot and Bio2RDF are useful in that they link to lots of related data but they don&#39;t really give you any information about what specimens are instances of that concept and they only have those species which have NCBI ID&#39;s.</div>



<div><br></div><div>What I want is a set of GUID&#39;s that resolve to a human readable HTML page and an RDF representation that people can use to &quot;tag&quot; their data.</div><div><br></div><div>For instance:</div><div>



<b><br></b></div><div><b> I am going to assert that what I have under the microscope is an instance of the concept described on this page. I do not tie this assertion to a particular name or classification hierarchy.</b></div>



<div><br></div><div>Because it makes no sense to replicate the functionality of the Encyclopedia of Life etc., I am mainly concentrating on the RDF representations and testing if they behave as expected in SPARQL queries.</div>



<div><br></div><div>* The HTML pages are not really pretty or as informative as the RDF or as the concept as viewed in the knowledge base.</div><div><br></div><div>I have been working with the Encyclopedia of Life and GNI groups for a while exploring how these may or may not be useful to them.</div>



<div><br></div><div>During my visited Woods Hole I said that I have no interest in building and empire I just want to build a solution and would like to partner with them and GBIF.</div><div><br></div><div>Although I remain active on TDWG I find the most valuable suggestions seem to come from the LOD community since we seem to have a common goal - that is creating something that works in a reasonable amount of time.</div>



<div><br></div><div>Also, in the LOD cloud every linked data set increases the value of all the other data sets.</div><div><br></div><div>This is probably more than your question required, but it provides some explanation as to what these are and why I have implemented them in the way I have.</div>



<div><br></div><div>Respectfully,</div><div><br></div><div>- Pete</div><div><br></div><div><br></div><div><br><div class="gmail_quote">On Fri, May 13, 2011 at 4:14 PM, Matt Jones <span dir="ltr">&lt;<a href="mailto:jones@nceas.ucsb.edu" target="_blank">jones@nceas.ucsb.edu</a>&gt;</span> wrote:<br>



<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Peter,<div><br></div><div>Does your idea of #ObjectiveSpeciesModel correspond 1:1 with the TCS standard&#39;s idea of a Nominal Concept (i.e., &lt;TaxonConcept type=&quot;nominal&quot;&gt;) ?  Can you outline how your concept types differ from TCS concept types?</div>




<div><br></div><div>Thanks,</div><div>Matt</div><div><div></div><div><div><br><div class="gmail_quote">On Fri, May 13, 2011 at 12:41 PM, Peter DeVries <span dir="ltr">&lt;<a href="mailto:pete.devries@gmail.com" target="_blank">pete.devries@gmail.com</a>&gt;</span> wrote:<br>




<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Nico,<div><br></div><div>Thanks for posting this.</div><div><br></div><div>I have something in the concept model to indicate the basis for the species concept.</div>




<div><br></div><div>For now I have three types. An individual species concept can have a combination of one, two or all three</div>
<div><br></div><div>In the RDF they look like this</div><div><br></div><div><font face="&#39;courier new&#39;, monospace">&lt;txn:speciesConceptBasedOn rdf:resource=&quot;<a href="http://lod.taxonconcept.org/ontology/txn.owl#ObjectiveSpeciesModel" target="_blank">http://lod.taxonconcept.org/ontology/txn.owl#ObjectiveSpeciesModel</a>&quot;/&gt;</font><br>





<br></div><div>The first is what I call the #ObjectiveSpeciesModel - this indicates that it is a species concept because we say it is.</div><div><br></div><div>All the species concepts are at least an #ObjectiveSpeciesModel</div>





<div><br></div><div>*This is in part a way to handle things like the domestic cat which you want to be seen as different from the African Wildcat.</div><div><br></div><div>There are also tags for </div><div><br></div><div>





txn:PhylogeneticSpeciesModel</div><div>txn:BiologicalSpeciesModel</div><div><br></div><div>For now I don&#39;t have these other models set in the example data, but fields are in the database and the code for that an editor could state the basis for the model.</div>





<div><br></div><div>I can think of a couple of different ways to handle the issue of alternative species concepts.</div><div><br></div><div>* Note that the identifications as proposed by DarwinCore don&#39;t seem to indicate what kind of model the identifications were based on.</div>





<div>  So it is not clear to me if a straight DarwinCore data set would allow the analysis above.</div><div><br></div><div>Instead of having multiple different statements like </div><div><br></div><div><b>txn:occurrenceHasSpeciesConcept &lt;&gt; </b>in the record for each occurrence</div>





<div><br></div><div>one could use different predicates to link to different kinds of species concepts.</div><div><br></div><div><b>txn:occurrenceHasUniprotConcept</b> =&gt; &lt;<a href="http://purl.uniprot.org/taxonomy/9696" target="_blank">http://purl.uniprot.org/taxonomy/9696</a>&gt;</div>





<div><br></div><div>This would allow someone to query for the occurrences of &lt;<a href="http://purl.uniprot.org/taxonomy/9696" target="_blank">http://purl.uniprot.org/taxonomy/9696</a>&gt;</div><div><br></div><div>That said, it is not clear to me what people mean by different identifications.</div>





<div><br></div><div>Is the intent to have identifications with different homotypic synonyms to be an identification of the same thing or not?</div><div><br></div><div>The way it works now in many data sets is that Felis concolor, Puma concolor and Puma conncolor are treated as identifications of different things.</div>





<div><br></div><div>This is another way of saying<i> is the namestring the concept?</i></div><div><i><br></i></div><div>My understanding of the eBird project is that it allows citizen scientists to contribute their own observations. This creates a much larger data set for analysis etc.</div>





<div><br></div><div>They have a created a curated list of species and a ~6 letter code for each. This serves as a guide for observers on how to encode their observations.</div><div><br></div><div>I think their progress would be inhibited, the occurrence coding inconsistant, and contributors frustrated, if they have a list that included many overlapping species concepts.</div>





<div><br></div><div>Thanks again for you comments,</div><div><br></div><div>- Pete</div><div><div><div></div><div> <br><div class="gmail_quote">On Fri, May 13, 2011 at 3:05 AM, Nico Franz <span dir="ltr">&lt;<a href="mailto:nico.franz@upr.edu" target="_blank">nico.franz@upr.edu</a>&gt;</span> wrote:<br>





<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

  
    
    
  
  <div text="#000000" bgcolor="#ffffff">
    Hello Pete (et al.):<br>
    <br>
       For bird, Town Peterson at KU and colleagues have published these
    papers showing how alternative bird taxonomies affect the ranking of
    conservation priorities.<br>
    <br>
<a href="http://specify5.specifysoftware.org/Informatics/bios/biostownpeterson/PN_CB_1999.pdf" target="_blank">http://specify5.specifysoftware.org/Informatics/bios/biostownpeterson/PN_CB_1999.pdf</a><br>
<a href="http://specify5.specifysoftware.org/Informatics/bios/biostownpeterson/NP_BN_2004.pdf" target="_blank">http://specify5.specifysoftware.org/Informatics/bios/biostownpeterson/NP_BN_2004.pdf</a><br>
<a href="http://specify5.specifysoftware.org/Informatics/bios/biostownpeterson/P_BCI_2006.pdf" target="_blank">http://specify5.specifysoftware.org/Informatics/bios/biostownpeterson/P_BCI_2006.pdf</a><br>
    <br>
       Here&#39;s the abstract of the 1999 paper:<br>
    <br>
    Analysis of geographic concentrations of endemic taxa is often used
    to determine priorities for conservation<br>
    action; nevertheless, assumptions inherent in the taxonomic
    authority list used as the basis for<br>
    analysis are not always considered. We analyzed foci of avian
    endemism in Mexico under two alternate species<br>
    concepts. Under the biological species concept, 101 bird species are
    endemic to Mexico and are concentrated<br>
    in the mountains of the western and southern portions of the
    country. Under the phylogenetic species<br>
    concept, however, total endemic species rises to 249, which are
    concentrated in the mountains and lowlands<br>
    of western Mexico. Twenty-four narrow endemic biological species are
    concentrated on offshore islands, but<br>
    97 narrow endemic phylogenetic species show a concentration in the
    Transvolcanic Belt of the mainland and<br>
    on several offshore islands. Our study demonstrates that
    conservation priorities based on concentrations of<br>
    endemic taxa depend critically on the particular taxonomic authority
    employed and that biodiversity evaluations<br>
    need to be developed in collaboration or consultation with
    practicing systematic specialists.<br>
    <br>
       There was a debate recently on Taxacom that was started and
    subsequently neatly summarized by Fabian Haas. The topic was &quot;let&#39;s
    summarize reasons why &#39;donors&#39; seem to not fund taxonomy&quot;. One point
    from the summary was this:<br>
    
    <p class="MsoNormal">3) Taxonomy is over-accurate for most
      applications <br>
    </p>
    <p class="MsoNormal">Most (not all) decisions in e.g. modelling and
      conservation
      are done and can be done without complete knowledge of taxa. As it
      is,
      decisions for conservation areas are often based on flagship
      species (e.g.
      elephants), on taxa which have an excellent research background,
      e.g. birds
      (IBAs), on availability of land (e.g. land with a high Tsetse
      burden),
      importance as corridor and other factors, but never on a complete
      view on an
      all biodiversity in a specific area. Even if an inventory existed,
      it would be
      an illusion that we could collect data on ecological requirements
      and
      population dynamics for most of the species necessary for informed
      decisions. A
      complete inventory does not seem to provide an advantage for
      conservation.</p>
       I personally think there&#39;s some truth to that. I also think that,
    while it&#39;s understandable that an accurate representation of the
    (sometimes) fleetingness of taxonomic consensus it not a priority
    for applied ecological projects, if taxonomists themselves don&#39;t
    find better ways to document and link these alternatives
    perspectives, then it&#39;s not the best science we can do. That would
    be fine too if adopted outright as a pragmatic stance.<br>
    <br>
    Regards,<br>
    <br>
    Nico<div><div></div><div><br>
    <br>
    <br>
    On 5/13/2011 1:08 AM, Peter DeVries wrote:
    </div></div><blockquote type="cite"><div><div></div><div>I thought that I would also mention that in addition
      to The Plants List, the eBird project also uses on overlapping
      concepts in its bird list (it does have concepts for common
      hybrids)
      <div><br>
      </div>
      <div>What is clear to me is that you cannot create graphs like
        these if every observation can have X number of species
        (especially those that overlapping ) without any indication
        which is is the most appropriate one.</div>
      <div><br>
      </div>
      <div>eBird Occurrence Maps Northern Cardinal</div>
      <div><a href="http://ebird.org/content/ebird/about/occurrence-maps/northern-cardinal" target="_blank">http://ebird.org/content/ebird/about/occurrence-maps/northern-cardinal</a><br clear="all">
        <br>
      </div>
      <div>NCBI is also similar.</div>
      <div><br>
      </div>
      <div>Perhaps a member of the consensus committee can comment?</div>
      <div><br>
        -- Pete<br>
------------------------------------------------------------------------------------<br>
        Pete DeVries<br>
        Department of Entomology<br>
        University of Wisconsin - Madison<br>
        445 Russell Laboratories<br>
        1630 Linden Drive<br>
        Madison, WI 53706<br>
        Email: <a href="mailto:pdevries@wisc.edu" target="_blank">pdevries@wisc.edu</a><br>
        <a href="http://www.taxonconcept.org/" target="_blank">TaxonConcept</a>  &amp;  <a href="http://about.geospecies.org/" target="_blank">GeoSpecies</a> Knowledge Bases<br>
        A Semantic Web, <a href="http://linkeddata.org/" target="_blank">Linked Open Data</a>  Project<br>
--------------------------------------------------------------------------------------<br>
      </div>
      </div></div><pre><fieldset></fieldset>
_______________________________________________
tdwg-content mailing list
<a href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a>
<a href="http://lists.tdwg.org/mailman/listinfo/tdwg-content" target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a>
</pre>
    </blockquote>
    <br>
  </div>

<br>_______________________________________________<br>
tdwg-content mailing list<br>
<a href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
<a href="http://lists.tdwg.org/mailman/listinfo/tdwg-content" target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
<br></blockquote></div><br><br clear="all"><br></div></div>-- <br><div>







------------------------------------------------------------------------------------<br>Pete DeVries<br>Department of Entomology<br>University of Wisconsin - Madison<br>445 Russell Laboratories<br>1630 Linden Drive<br>Madison, WI 53706<br>





Email: <a href="mailto:pdevries@wisc.edu" target="_blank">pdevries@wisc.edu</a><br><a href="http://www.taxonconcept.org/" target="_blank">TaxonConcept</a>  &amp;  <a href="http://about.geospecies.org/" target="_blank">GeoSpecies</a> Knowledge Bases<br>





A Semantic Web, <a href="http://linkeddata.org/" target="_blank">Linked Open Data</a>  Project<br>--------------------------------------------------------------------------------------<br>
</div></div>
<br>_______________________________________________<br>
tdwg-content mailing list<br>
<a href="mailto:tdwg-content@lists.tdwg.org" target="_blank">tdwg-content@lists.tdwg.org</a><br>
<a href="http://lists.tdwg.org/mailman/listinfo/tdwg-content" target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
<br></blockquote></div><br></div>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>







------------------------------------------------------------------------------------<br>Pete DeVries<br>Department of Entomology<br>University of Wisconsin - Madison<br>445 Russell Laboratories<br>1630 Linden Drive<br>Madison, WI 53706<br>



Email: <a href="mailto:pdevries@wisc.edu" target="_blank">pdevries@wisc.edu</a><br><a href="http://www.taxonconcept.org/" target="_blank">TaxonConcept</a>  &amp;  <a href="http://about.geospecies.org/" target="_blank">GeoSpecies</a> Knowledge Bases<br>



A Semantic Web, <a href="http://linkeddata.org/" target="_blank">Linked Open Data</a>  Project<br>--------------------------------------------------------------------------------------<br>
</div>