Hi David,<div><br></div><div>In cases like <a href="http://gni.globalnames.org/name_strings/Danaus_plexippus">http://gni.globalnames.org/name_strings/Danaus_plexippus</a> you are correct.</div><div><br></div><div>But remember how URLs are encoded so many things will not work and different system seem to treat these differently.</div>
<div><br></div><div>The space &quot; &quot; in the above example would need to be precent encoded.</div><div><br></div><div>I would suggest that we use underscores &quot;_&quot; for spaces.</div><div><br></div><div>Any spaces, accented characters, commas or parenthesis would need to be % encoded so.</div>
<div><br></div><div><a href="http://gni.globalnames.org/name_strings/Danaus_plexippus_(Linnaeus_1758)">http://gni.globalnames.org/name_strings/Danaus_plexippus_(Linnaeus_1758)</a> =&gt; <a href="http://gni.globalnames.org/name_strings/Danaus_plexippus_%28Linnaeus_1758%29">http://gni.globalnames.org/name_strings/Danaus_plexippus_%28Linnaeus_1758%29</a><br>
</div><div><br></div><div>Try pasting the first url into the browser and then copy it back. Depending on what browser you use it will either be % encoded or not.</div><div><br></div><div>So to the extent that the URI can be &quot;Cool URI&#39;s <a href="http://www.w3.org/TR/cooluris/">http://www.w3.org/TR/cooluris/</a> using the name will work.</div>
<div><br></div><div>Respectfully,</div><div><br></div><div>- Pete</div><div><br><div class="gmail_quote">On Fri, Jun 3, 2011 at 6:59 AM, David Remsen (GBIF) <span dir="ltr">&lt;<a href="mailto:dremsen@gbif.org">dremsen@gbif.org</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Why not use the name as the basis for the resolvable identifier instead of<br>
a uuid. Isnt there a 1:1 cardinality between the name and the uuid in the<br>
GNI?  Doesnt that mean that<br>
<div class="im"><br>
<a href="http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec" target="_blank">http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec</a><br>
</div>and<br>
<a href="http://gni.globalnames.org/name_strings/Danaus_plexippus_(Linnaeus_1758)" target="_blank">http://gni.globalnames.org/name_strings/Danaus_plexippus_(Linnaeus_1758)</a><br>
<br>
are equally unique?  The latter is certainly more readable.  In those<br>
cases where the namestring is a homonym like<br>
<br>
<a href="http://gni.globalnames.org/name_strings/Oenanthe" target="_blank">http://gni.globalnames.org/name_strings/Oenanthe</a><br>
<br>
couldn&#39;t you just return the addresses of the two globally unique forms of<br>
the name when you resolve it?<br>
<br>
<a href="http://gni.globalnames.org/name_strings/Oenanthe_Smith_1899" target="_blank">http://gni.globalnames.org/name_strings/Oenanthe_Smith_1899</a><br>
<br>
<a href="http://gni.globalnames.org/name_strings/Oenanthe_Jones_1900" target="_blank">http://gni.globalnames.org/name_strings/Oenanthe_Jones_1900</a><br>
<br>
Wouldn&#39;t those be as globally unique and easier to read and adjust to?  Or<br>
am I missing something.  I always wanted to do that with ubio IDs after a<br>
back and forth with Gregor Hagedorn and wished we hadn&#39;t exposed those<br>
integers.<br>
<br>
DR<br>
<div><div></div><div class="h5"><br>
&gt; Hi Steve,<br>
&gt;<br>
&gt; I don&#39;t have time to go through this in detail, and I can&#39;t speak for the<br>
&gt; GNI, but I can tell you about how the GNI URI&#39;s work at least for now.<br>
&gt;<br>
&gt; A while back Dima Mozzherin and I were looking into how triples etc. might<br>
&gt; be of use to the GNI.<br>
&gt;<br>
&gt; We needed a way to generate unique URI&#39;s for each name.<br>
&gt;<br>
&gt; We wanted to avoid having to keep these in sync and not require everyone<br>
&gt; to<br>
&gt; look each ID up through some service.<br>
&gt;<br>
&gt; Dima came up with the following plan. We use the namestring as seed to<br>
&gt; generate a unique UUID.<br>
&gt;<br>
&gt; Basically this is a shared algorithm which the GNI and TaxonConcept both<br>
&gt; use. But it could be used by anyone.<br>
&gt;<br>
&gt; You feed the name string to the algorithm and it spits out a UUID. We<br>
&gt; append<br>
&gt; then append that to a URI and web service so it is resolvable.<br>
&gt;<br>
&gt; So the name Danaus plexippus (Linnaeus 1758)<br>
&gt; =&gt; 4ef223c4-0c3e-5e84-ace9-755c34c601ec<br>
&gt;<br>
&gt; So if the GNI and and another group have the same namestring they have the<br>
&gt; same UUID.<br>
&gt;<br>
&gt; People can then can link their data set to the GNI with the following URI<br>
&gt;<br>
&gt; <a href="http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec" target="_blank">http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec</a><br>
&gt;<br>
&gt; RDF<br>
&gt; <a href="http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec.rdf" target="_blank">http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec.rdf</a><br>
&gt;<br>
&gt; &lt;<a href="http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec.rdf" target="_blank">http://gni.globalnames.org/name_strings/4ef223c4-0c3e-5e84-ace9-755c34c601ec.rdf</a>&gt;If<br>
&gt; you think of your data set as one table and the GNI as another, this URI<br>
&gt; serves as the foreign key that connects them together.<br>
&gt;<br>
&gt; Some on the list don&#39;t like how these look, but there is a tremendous<br>
&gt; advantage in not having to worry about syncing two large data sets and<br>
&gt; determining if a given integer is already in use.<br>
&gt;<br>
&gt; Also Rod Page has written a recently about UUID&#39;s.<br>
&gt; <a href="http://iphylo.blogspot.com/2011/05/zoobank-on-couchdb-uuids-replication.html" target="_blank">http://iphylo.blogspot.com/2011/05/zoobank-on-couchdb-uuids-replication.html</a><br>
&gt;<br>
&gt; &lt;<a href="http://iphylo.blogspot.com/2011/05/zoobank-on-couchdb-uuids-replication.html" target="_blank">http://iphylo.blogspot.com/2011/05/zoobank-on-couchdb-uuids-replication.html</a>&gt;There<br>
&gt; may be a way to do something similar with <a href="http://bit.ly" target="_blank">bit.ly</a> like identifiers that are<br>
&gt; shorter (mCcSp), but I think it the general idea is a good one.<br>
&gt;<br>
&gt; If you recall from my talk at TDWG, I was able to use these to make<br>
&gt; statements that one namestring was a synonym etc. of another etc.<br>
&gt;<br>
&gt; The algorithm we use is written in Ruby but I could be ported to many<br>
&gt; different languages since UUIDs are widely supported.<br>
&gt;<br>
&gt; Respectfully,<br>
&gt;<br>
&gt; - Pete<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On Thu, Jun 2, 2011 at 11:41 PM, Steven J. Baskauf &lt;<br>
&gt; <a href="mailto:steve.baskauf@vanderbilt.edu">steve.baskauf@vanderbilt.edu</a>&gt; wrote:<br>
&gt;<br>
&gt;&gt;  My email access has been sporadic since this thread developed, so at<br>
&gt;&gt; this<br>
&gt;&gt; point I&#39;ll respond to points made in several of the messages.<br>
&gt;&gt;<br>
&gt;&gt; First, I should note that there has been previous discussion on this<br>
&gt;&gt; list<br>
&gt;&gt; on a similar topic from<br>
&gt;&gt; <a href="http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002231.htmlthrough" target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002231.htmlthrough</a><br>
&gt;&gt; <a href="http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002231.html" target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002231.html</a>.<br>
&gt;&gt; One can review what was said at that time rather quickly by starting on<br>
&gt;&gt; the<br>
&gt;&gt; first linked message and clicking on the &quot;Next Message&quot; link until you<br>
&gt;&gt; get<br>
&gt;&gt; to the end of the range I gave above.<br>
&gt;&gt;<br>
&gt;&gt; My reason for the request for information that started this thread was<br>
&gt;&gt; that<br>
&gt;&gt; I wanted to link to a URI that would anchor the name portion of a<br>
&gt;&gt; name/sensu<br>
&gt;&gt; pair (TNU or Taxon Concept a la TCS if you prefer) as in this RDF<br>
&gt;&gt; snippet:<br>
&gt;&gt;<br>
&gt;&gt;    &lt;tc:nameString&gt;Quercus rubra L.&lt;/tc:nameString&gt;<br>
&gt;&gt;    &lt;tc:hasName<br>
&gt;&gt; rdf:about=&quot;<a href="http://www.ubio.org/authority/metadata.php?lsid=urn:lsid:ubio.org:namebank:448439" target="_blank">http://www.ubio.org/authority/metadata.php?lsid=urn:lsid:ubio.org:namebank:448439</a>&quot;<br>

&gt;&gt; &lt;<a href="http://www.ubio.org/authority/metadata.php?lsid=urn:lsid:ubio.org:namebank:448439" target="_blank">http://www.ubio.org/authority/metadata.php?lsid=urn:lsid:ubio.org:namebank:448439</a>&gt;/&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; At this point in the discussion, I&#39;m not actually talking about creating<br>
&gt;&gt; a<br>
&gt;&gt; link to a taxon concept but rather to a taxon name, so some of the<br>
&gt;&gt; issues<br>
&gt;&gt; Pete raised don&#39;t apply here (e.g. what&#39;s the &quot;right&quot; name for a concept<br>
&gt;&gt; -<br>
&gt;&gt; the question here is simply what&#39;s a stable identifier for the name) .<br>
&gt;&gt; In<br>
&gt;&gt; principle, I could probably just provide the name string and be done<br>
&gt;&gt; with<br>
&gt;&gt; it.  However, having some degree of faith that Smart, Computer Savvy<br>
&gt;&gt; People<br>
&gt;&gt; might some day be able to use the metadata returned by the URI (or<br>
&gt;&gt; perhaps<br>
&gt;&gt; metadata which they already have in a triple store onsite) to do cool<br>
&gt;&gt; things<br>
&gt;&gt; like knowing that my name is the same as an orthographic variant or that<br>
&gt;&gt; &quot;Quercus rubra  L.&quot; is basically the same thing as &quot;Quercus rubra&quot;, I<br>
&gt;&gt; would<br>
&gt;&gt; like to also provide a functional URI.<br>
&gt;&gt;<br>
&gt;&gt; As an end -user who isn&#39;t very interested in the technical issues<br>
&gt;&gt; involving<br>
&gt;&gt; names, I don&#39;t really care what URI I use.  I would prefer for it to be<br>
&gt;&gt; widely recognized and for it to &quot;work&quot; (i.e. be resolvable).  In the<br>
&gt;&gt; earlier<br>
&gt;&gt; (January) thread, there was discussion about existing identifiers.<br>
&gt;&gt; There<br>
&gt;&gt; were a number of posts, but in particular<br>
&gt;&gt; <a href="http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002258.html" target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002258.html</a><br>
&gt;&gt; <a href="http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002259.htmldiscussed" target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/2011-January/002259.htmldiscussed</a><br>
&gt;&gt; the relative merits of ITIS and uBio ID numbers.  My take-home<br>
&gt;&gt; message from this was that uBio represented the largest single set of<br>
&gt;&gt; names<br>
&gt;&gt; with assigned identifiers (see<br>
</div></div>&gt;&gt; <a href="http://gni.globalnames.org/data_sourcescited" target="_blank">http://gni.globalnames.org/data_sourcescited</a> in Pete&#39;s email) and that<br>
<div><div></div><div class="h5">&gt;&gt; uBio metadata provides useful references.<br>
&gt;&gt; Hence my interest in referencing uBio ids as a URI.  However, as a<br>
&gt;&gt; practical<br>
&gt;&gt; matter, the organizations that I share images with either want ITIS TSNs<br>
&gt;&gt; (EOL and Morphbank) or just names (Discover Life).  Nobody is asking for<br>
&gt;&gt; uBio identifiers or any other identifier.<br>
&gt;&gt;<br>
&gt;&gt; I found Kevin&#39;s comment at<br>
&gt;&gt; <a href="http://lists.tdwg.org/pipermail/tdwg-content/2011-May/002486.html" target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/2011-May/002486.html</a> very<br>
&gt;&gt; thought-provoking: &quot;My thoughts are that the most likely way this will<br>
&gt;&gt; be<br>
&gt;&gt; solved is by standard market type pressures - ie the best solution/IDs<br>
&gt;&gt; will<br>
&gt;&gt; be used the most and &#39;float&#39; to the top.&quot;  I&#39;m not going to make a<br>
&gt;&gt; judgment<br>
&gt;&gt; about what is the &quot;best&quot; solution or ID.  But I would say that in<br>
&gt;&gt; &quot;computer&quot;<br>
&gt;&gt; history, being the &quot;best&quot; doesn&#39;t necessarily mean that something will<br>
&gt;&gt; be<br>
&gt;&gt; used.  Take for example, the FOAF vocabulary.  What the heck is Friend<br>
&gt;&gt; of a<br>
&gt;&gt; Friend?  I would venture to say that most of the people using the FOAF<br>
&gt;&gt; vocabulary don&#39;t know or care.  The FOAF vocabulary was the one that<br>
&gt;&gt; people<br>
&gt;&gt; started to use and once that happened, people didn&#39;t switch even if<br>
&gt;&gt; there<br>
&gt;&gt; was something better.  I&#39;m not familiar with the history of other stuff<br>
&gt;&gt; like<br>
&gt;&gt; YouTube and Craig&#39;s List, but I would guess that they weren&#39;t<br>
&gt;&gt; necessarily<br>
&gt;&gt; &quot;the best&quot; systems - they were just the one that the most people started<br>
&gt;&gt; using first and once that happened, people didn&#39;t switch.  I&#39;m using<br>
&gt;&gt; ITIS<br>
&gt;&gt; IDs because they are easy to get and the people I communicate with want<br>
&gt;&gt; them.  Whether they are the &quot;best&quot; or &quot;done correctly&quot; doesn&#39;t matter to<br>
&gt;&gt; me<br>
&gt;&gt; as much as the fact that that they are widely recognized and stable (and<br>
&gt;&gt; that thus far every name that I&#39;ve looked for has been in their<br>
&gt;&gt; database).<br>
&gt;&gt;<br>
&gt;&gt; I think that one reason why this question has been on my mind is that<br>
&gt;&gt; I&#39;ve<br>
&gt;&gt; been waiting for GNUB (Global Name Use Bank) to come out.  I&#39;m not<br>
&gt;&gt; really up<br>
&gt;&gt; on how it is going to work, but my impression is that it was going to be<br>
&gt;&gt; based on the Global Name Index (GNI) which was mentioned in that earlier<br>
&gt;&gt; January thread.  At that point, the GNI names didn&#39;t have any<br>
&gt;&gt; identifiers<br>
&gt;&gt; that were exposed to the public as permanent GUIDs.  I&#39;m assuming that<br>
&gt;&gt; if<br>
&gt;&gt; GNUB refers to GNI names, they will have some kind of identifiers.  So<br>
&gt;&gt; if<br>
&gt;&gt; that happens how is the GUID recommendation 8 going to be followed?  As<br>
&gt;&gt; Kevin said in<br>
&gt;&gt; <a href="http://lists.tdwg.org/pipermail/tdwg-content/2011-June/002499.html" target="_blank">http://lists.tdwg.org/pipermail/tdwg-content/2011-June/002499.html</a> &quot;What<br>
&gt;&gt; I<br>
&gt;&gt; take from recommendation 8 of the GUID applicability guide ... is that<br>
&gt;&gt; if<br>
&gt;&gt; you DON&#39;T already have a record in your own database for a taxon<br>
&gt;&gt; name/concept, then reuse an existing one.  &quot;  What we have here with GNI<br>
&gt;&gt; is<br>
&gt;&gt; a situation where none of the records have identifiers.  In my mind, the<br>
&gt;&gt; &quot;best practice&quot; according to recommendation 8 would be for the GNI to<br>
&gt;&gt; reuse<br>
&gt;&gt; existing identifiers where they exist and NOT make up new ones.  This is<br>
&gt;&gt; a<br>
&gt;&gt; bit more complicated because the ITIS identifiers (which are in common<br>
&gt;&gt; use)<br>
&gt;&gt; don&#39;t have an http URI version that is resolvable, and while the uBio<br>
&gt;&gt; identifiers have a resolvable http URI, it&#39;s in the form of a proxied<br>
&gt;&gt; LSID,<br>
&gt;&gt; which I&#39;ve already complained is very ugly.  So I&#39;d like to hear some<br>
&gt;&gt; ideas<br>
&gt;&gt; about how to have &quot;reused&quot; identifiers in the GNI.<br>
&gt;&gt;<br>
&gt;&gt; One thing that comes to my mind would be to have a &quot;domain name&quot; like<br>
</div></div>&gt;&gt; &quot;<a href="http://purl.org/gni/" target="_blank">http://purl.org/gni/</a>&quot; &lt;<a href="http://purl.org/gni/" target="_blank">http://purl.org/gni/</a>&gt; or<br>
&gt;&gt; &quot;<a href="http://purl.org/tn/" target="_blank">http://purl.org/tn/</a>&quot;&lt;<a href="http://purl.org/tn/" target="_blank">http://purl.org/tn/</a>&gt;(&quot;tn&quot; for &quot;taxon name&quot;) and to<br>

<div><div></div><div class="h5">&gt;&gt; follow it with a namespace/id combination<br>
&gt;&gt; similar to what is done with lsids.  So for example &quot;itis/19408&quot; and<br>
&gt;&gt; &quot;ubio/448439&quot; could be appended, creating<br>
&gt;&gt; <a href="http://purl.org/gni/itis/19408and" target="_blank">http://purl.org/gni/itis/19408and</a><br>
&gt;&gt; <a href="http://purl.org/gni/ubio/448439" target="_blank">http://purl.org/gni/ubio/448439</a> for &quot;Quercus rubra  L.&quot;  Both URIs could<br>
&gt;&gt; point to the same RDF and that RDF could indicate that the two<br>
&gt;&gt; identifiers<br>
&gt;&gt; are owl:sameAs .  I realize from what Bob Morris has cautioned in the<br>
&gt;&gt; past<br>
&gt;&gt; that there are problems with owl:sameAs when the two things aren&#39;t<br>
&gt;&gt; actually<br>
&gt;&gt; the same thing (e.g. if the uBio ID refers to a name string only but the<br>
&gt;&gt; ITIS TSN refers to the name plus an &quot;accepted&quot; status and a relationship<br>
&gt;&gt; to<br>
&gt;&gt; parent taxa).  However, if there were an understanding that the GNI only<br>
&gt;&gt; refers to name strings, then one could still refer to<br>
&gt;&gt; <a href="http://purl.org/gni/itis/19408" target="_blank">http://purl.org/gni/itis/19408</a> as an identifier for the name string of<br>
&gt;&gt; the<br>
&gt;&gt; thing (whatever it is) that is referred to by an ITIS TSN of 19408.  I<br>
&gt;&gt; don&#39;t<br>
&gt;&gt; think there would be a problem saying that and the ubio ID were<br>
&gt;&gt; &quot;owl:sameAs&quot;.  Some kind of solution like this would allow people to<br>
&gt;&gt; easily<br>
&gt;&gt; generate a resolvable URI for a name if they were using ITIS TSNs or<br>
&gt;&gt; uBio<br>
&gt;&gt; IDs.  If the name that one wanted to use was so obscure that it was one<br>
&gt;&gt; of<br>
&gt;&gt; the 9.5 million names that uBio has that ITIS doesn&#39;t have, then that<br>
&gt;&gt; name<br>
&gt;&gt; would only have the ubio version.  I have no idea whether this would be<br>
&gt;&gt; a<br>
&gt;&gt; good idea or not, but I was really cringing to think about 19 million<br>
&gt;&gt; newly<br>
&gt;&gt; minted UUIDs appended to<br>
</div></div>&gt;&gt; &quot;<a href="http://gni.globalnames.org/" target="_blank">http://gni.globalnames.org/</a>&quot;&lt;<a href="http://gni.globalnames.org/" target="_blank">http://gni.globalnames.org/</a>&gt;and figuring<br>

<div><div></div><div class="h5">&gt;&gt; out how to connect those horrid things to the names and ITIS<br>
&gt;&gt; TSNs that I&#39;m already using.  I think that I said this before, but using<br>
&gt;&gt; the<br>
&gt;&gt; <a href="http://purl.org" target="_blank">purl.org</a> domain rather than one like <a href="http://gni.globalnames.org/" target="_blank">http://gni.globalnames.org/</a> would<br>
&gt;&gt; in<br>
&gt;&gt; the future allow somebody else to take over management of providing the<br>
&gt;&gt; metadata when the GUIDs are resolved without having to deal with issues<br>
&gt;&gt; of<br>
&gt;&gt; who &quot;owns&quot; the domain name.<br>
&gt;&gt;<br>
&gt;&gt; Steve<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Kevin Richards wrote:<br>
&gt;&gt;<br>
&gt;&gt;  Pete,<br>
&gt;&gt;<br>
&gt;&gt; I’m not trying to say what you are doing is a waste of time/impossible.<br>
&gt;&gt; I<br>
&gt;&gt; actually think RDF + semantics are a good way forward, but this really<br>
&gt;&gt; implies that we need to rely on the semantics and linkages rather than<br>
&gt;&gt; having a SINGLE ID for a taxon name.  (which is what I thought Steve was<br>
&gt;&gt; getting at).  Each instance of a taxon name can have its own ID and then<br>
&gt;&gt; all<br>
&gt;&gt; these instances are connected via ontology defined semantic links.  This<br>
&gt;&gt; seems more appropriate to me than insisting everyone uses the “Global<br>
&gt;&gt; Taxon<br>
&gt;&gt; Name ID X”.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; In your example of *Aedes triseriatus* and *Ochlerotatus triseriatus* –<br>
&gt;&gt; these are two different names so they need two different IDs, they may<br>
&gt;&gt; be<br>
&gt;&gt; linked by a single taxon concept, but they are separate names.  So which<br>
&gt;&gt; of<br>
&gt;&gt; these now 3 IDs do you expect people to use, and according to what<br>
&gt;&gt; source??<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; For example if we have a name, eg the Robin, Erithacus rubecula,<br>
&gt;&gt; mentioned<br>
&gt;&gt; in IT IS (TSN : 559964) and also in EOL (<a href="http://www.eol.org/pages/1051567" target="_blank">www.eol.org/pages/1051567</a>),<br>
&gt;&gt; also<br>
&gt;&gt; in GBIF (<a href="http://data.gbif.org/species/21266780" target="_blank">http://data.gbif.org/species/21266780</a>), also in avibase (<br>
&gt;&gt; <a href="http://avibase.bsc-eoc.org/species.jsp?avibaseid=C809B2B90399A43D" target="_blank">http://avibase.bsc-eoc.org/species.jsp?avibaseid=C809B2B90399A43D</a>),<br>
&gt;&gt; which<br>
&gt;&gt; ID are you hoping people will use??  Would you put the IT IS ID in your<br>
&gt;&gt; own<br>
&gt;&gt; dataset as the ID for that name – unlikely.  Or would it be better to<br>
&gt;&gt; link<br>
&gt;&gt; them up with semantic linkages.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; What I take from recommendation 8 of the GUID applicability guide (as<br>
&gt;&gt; Steve<br>
&gt;&gt; puts is &quot;stop making up new identifiers when somebody else already has<br>
&gt;&gt; one<br>
&gt;&gt; for the thing you are talking about”) is that if you DON’T already have<br>
&gt;&gt; a<br>
&gt;&gt; record in your own database for a taxon name/concept, then reuse an<br>
&gt;&gt; existing<br>
&gt;&gt; one.  NOT ditch all your current IDs and adopt someone else’s<br>
&gt;&gt; (especially<br>
&gt;&gt; hard considering it is so hard to work out which if the multitude of<br>
&gt;&gt; names<br>
&gt;&gt; ad concept IDs that directly relates to your taxon name).<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I am all for limiting the number of IDs for the “same” thing, but in<br>
&gt;&gt; some<br>
&gt;&gt; cases it is more useful to build linkages than force this tight<br>
&gt;&gt; integration<br>
&gt;&gt; of data and IDs.  Especially for taxon names and concepts, where it is<br>
&gt;&gt; complex to define if you are even talking about the “same” thing or not.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Kevin<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; *From:* Peter DeVries<br>
</div></div>&gt;&gt; [mailto:<a href="mailto:pete.devries@gmail.com">pete.devries@gmail.com</a>&lt;<a href="mailto:pete.devries@gmail.com">pete.devries@gmail.com</a>&gt;]<br>
<div><div></div><div class="h5">&gt;&gt;<br>
&gt;&gt; *Sent:* Wednesday, 1 June 2011 12:38 p.m.<br>
&gt;&gt; *To:* Kevin Richards<br>
&gt;&gt; *Cc:* Steve Baskauf; <a href="mailto:tdwg-content@lists.tdwg.org">tdwg-content@lists.tdwg.org</a>; Gerald Guala;<br>
&gt;&gt; Nicolson,<br>
&gt;&gt; David; Alan J Hampson; Orrell, Thomas<br>
&gt;&gt; *Subject:* Re: [tdwg-content] ITIS TSNID to uBio NamebankIDs mapping<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Hi Kevin,<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I forgot one mention some other things that are different about my<br>
&gt;&gt; project.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; You can write a simple SPARQL query to get a list of all the<br>
&gt;&gt; TaxonConcept&#39;s<br>
&gt;&gt; that have ITIS ids, or all those that have ITIS and NCBI ID&#39;s etc.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; You can do this on any SPARQL endpoint that hosts the data.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; You can download the entire data set and run the queries on your own<br>
&gt;&gt; endpoint.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; You can write a script that runs the query and downloads the ITIS<br>
&gt;&gt; numbers<br>
&gt;&gt; and exports them to CSV etc.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; - Pete<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; On Tue, May 31, 2011 at 5:16 PM, Peter DeVries &lt;<a href="mailto:pete.devries@gmail.com">pete.devries@gmail.com</a>&gt;<br>
&gt;&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; Hi Kevin,<br>
&gt;&gt;<br>
&gt;&gt; On Tue, May 31, 2011 at 3:27 PM, Kevin Richards &lt;<br>
&gt;&gt; <a href="mailto:RichardsK@landcareresearch.co.nz">RichardsK@landcareresearch.co.nz</a>&gt; wrote:<br>
&gt;&gt;<br>
&gt;&gt; This is exactly why this problem still exists and will be very complex<br>
&gt;&gt; to<br>
&gt;&gt; solve - everyone says &quot;we should have a single ID for a specific taxon<br>
&gt;&gt; name,<br>
&gt;&gt; there seems to be several IDs &#39;out there&#39; that refer to the same taxon<br>
&gt;&gt; name,<br>
&gt;&gt; so Im going to create another ID to link them all up&quot; - yet another ID<br>
&gt;&gt; that<br>
&gt;&gt; no one will particularly want to follow - you would have to get everyone<br>
&gt;&gt; to<br>
&gt;&gt; agree that your combinations/integration of taxon names is the best one<br>
&gt;&gt; and<br>
&gt;&gt; hope everyone follows it - unlikely in this domain.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Isn&#39;t this kind of what the The Plant List, and eBird already do?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; A difference being that they tie these to a specific name and specific<br>
&gt;&gt; classification.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; The Plant list is not really even open so it is difficult to people to<br>
&gt;&gt; adopt it in mass.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; For instance, if I manage a herbarium, how do I easily reconcile my<br>
&gt;&gt; species<br>
&gt;&gt; list with the entities represented in the Plant List?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; eBird has millions of records which implies that they have been able to<br>
&gt;&gt; convince the observers in the field to adopt their system. You are<br>
&gt;&gt; correct<br>
&gt;&gt; in that there are probably a lot of taxonomists that don&#39;t like their<br>
&gt;&gt; list.<br>
&gt;&gt;<br>
&gt;&gt; It differs from many of the other classifications, but remember the<br>
&gt;&gt; system<br>
&gt;&gt; rewards them for not agreeing. Note the difference between the microbial<br>
&gt;&gt; taxonomists and other taxonomists. In the case of the microbial<br>
&gt;&gt;<br>
&gt;&gt; workers, the system rewards them for solving problems not debating<br>
&gt;&gt; alternatives. Also, if a good idea comes out that will make it easier<br>
&gt;&gt; for<br>
&gt;&gt; the microbiologists to solve the problems they are rewarded for solving,<br>
&gt;&gt; they are less likely to care whose idea it is.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Like the microbiologists, there are lots of biologists that work with<br>
&gt;&gt; species with the goal of addressing some non-taxonomic problem.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; They don&#39;t really care if the name is *Aedes triseriatus* or<br>
&gt;&gt; *Ochlerotatus<br>
&gt;&gt; triseriatus, *but they do care that the identifier that they connect<br>
&gt;&gt; their<br>
&gt;&gt; data to is stable.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; In regards to the issue of market forces,I suspect (but have no<br>
&gt;&gt; knowledge<br>
&gt;&gt; of) that there were probably decisions made in devising these lists that<br>
&gt;&gt; have more to do with appeasing certain personalities that creating best<br>
&gt;&gt; list. With the way this system rewards people it is likely that the<br>
&gt;&gt; &quot;correct&quot; version will float to the top only after that person has<br>
&gt;&gt; passed<br>
&gt;&gt; away. I don&#39;t have much faith that the best system will always float to<br>
&gt;&gt; the<br>
&gt;&gt; top, That has a lot to do with the personalities and how the system<br>
&gt;&gt; rewards<br>
&gt;&gt; are setup. Theoretically, it is possible for one strong personality or<br>
&gt;&gt; group<br>
&gt;&gt; to force others to adopt their less than optimal solution - at least<br>
&gt;&gt; this<br>
&gt;&gt; seems to happen in other environments.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Also, there are all sorts of ways that people can use the publication<br>
&gt;&gt; record to rewrite history. Simply cite the review paper that cites the<br>
&gt;&gt; original paper. Or don&#39;t cite it at all.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I would have used only the ITIS TSN but if the name changes the ID<br>
&gt;&gt; changes.<br>
&gt;&gt; This isn&#39;t &quot;wrong&quot;, it just does not solve my problem.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; * ITIS also should add the spiders from the World Spider Catalog.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Another issue that I think has inhibited adoption of a common list is<br>
&gt;&gt; that<br>
&gt;&gt; people can&#39;t agree on a particular name or a particular classification.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; Since you can model a species concept as having many names and many<br>
&gt;&gt; classifications why not do so?<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; If this idea was originally accepted, I would not have needed to create<br>
&gt;&gt; TaxonConcept.org.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; My plan has aways been to get something that works to solve some<br>
&gt;&gt; problems<br>
&gt;&gt; and then let some larger group take it over.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; In a sense, I am more like the microbiologists in that I am not being<br>
&gt;&gt; paid<br>
&gt;&gt; to solve this or debate this problem.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I am doing it because I think something like this is needed, and it is<br>
&gt;&gt; an<br>
&gt;&gt; interesting and personally rewarding puzzle.<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; - Pete<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; My thoughts are that the most likely way this will be solve is by<br>
&gt;&gt; stnadard<br>
&gt;&gt; market type pressures - ie the best solution/IDs will be used the most<br>
&gt;&gt; and<br>
&gt;&gt; &quot;float&quot; to the top.  It is easy to say that the global taxon name data<br>
&gt;&gt; is a<br>
&gt;&gt; mess, but if you think about it 30 years ago taxon name data were very<br>
&gt;&gt; disparate, duplicated, unconnected, many with NO IDs at all.  So I<br>
&gt;&gt; beleive<br>
&gt;&gt; we are making progress and that we will continue to do so albeit at a<br>
&gt;&gt; fairly<br>
&gt;&gt; slow rate.<br>
&gt;&gt;<br>
&gt;&gt; Kevin<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; &quot;I agree. This was one of the reasons that I setup TaxonConcept the way<br>
&gt;&gt; I<br>
&gt;&gt; did. It attempts to connect both the LOD entities and the foreign key<br>
&gt;&gt; based<br>
&gt;&gt; entities.&quot;<br>
&gt;&gt;<br>
&gt;&gt;  Please consider the environment before printing this email<br>
&gt;&gt; Warning:  This electronic message together with any attachments is<br>
&gt;&gt; confidential. If you receive it in error: (i) you must not read, use,<br>
&gt;&gt; disclose, copy or retain it; (ii) please contact the sender immediately<br>
&gt;&gt; by<br>
&gt;&gt; reply email and then delete the emails.<br>
&gt;&gt; The views expressed in this email may not be those of Landcare Research<br>
&gt;&gt; New<br>
&gt;&gt; Zealand Limited. <a href="http://www.landcareresearch.co.nz" target="_blank">http://www.landcareresearch.co.nz</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt;<br>
&gt;&gt; ------------------------------------------------------------------------------------<br>
&gt;&gt; Pete DeVries<br>
&gt;&gt; Department of Entomology<br>
&gt;&gt; University of Wisconsin - Madison<br>
&gt;&gt; 445 Russell Laboratories<br>
&gt;&gt; 1630 Linden Drive<br>
&gt;&gt; Madison, WI 53706<br>
&gt;&gt; Email: <a href="mailto:pdevries@wisc.edu">pdevries@wisc.edu</a><br>
</div></div>&gt;&gt; TaxonConcept &lt;<a href="http://www.taxonconcept.org/" target="_blank">http://www.taxonconcept.org/</a>&gt;  &amp;<br>
&gt;&gt; GeoSpecies&lt;<a href="http://about.geospecies.org/" target="_blank">http://about.geospecies.org/</a>&gt; Knowledge<br>
&gt;&gt; Bases<br>
&gt;&gt; A Semantic Web, Linked Open Data &lt;<a href="http://linkeddata.org/" target="_blank">http://linkeddata.org/</a>&gt;  Project<br>
<div class="im">&gt;&gt;<br>
&gt;&gt; --------------------------------------------------------------------------------------<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt;<br>
&gt;&gt; ------------------------------------------------------------------------------------<br>
&gt;&gt; Pete DeVries<br>
&gt;&gt; Department of Entomology<br>
&gt;&gt; University of Wisconsin - Madison<br>
&gt;&gt; 445 Russell Laboratories<br>
&gt;&gt; 1630 Linden Drive<br>
&gt;&gt; Madison, WI 53706<br>
&gt;&gt; Email: <a href="mailto:pdevries@wisc.edu">pdevries@wisc.edu</a><br>
</div>&gt;&gt; TaxonConcept &lt;<a href="http://www.taxonconcept.org/" target="_blank">http://www.taxonconcept.org/</a>&gt;  &amp;<br>
&gt;&gt; GeoSpecies&lt;<a href="http://about.geospecies.org/" target="_blank">http://about.geospecies.org/</a>&gt; Knowledge<br>
&gt;&gt; Bases<br>
&gt;&gt; A Semantic Web, Linked Open Data &lt;<a href="http://linkeddata.org/" target="_blank">http://linkeddata.org/</a>&gt;  Project<br>
<div class="im">&gt;&gt;<br>
&gt;&gt; --------------------------------------------------------------------------------------<br>
&gt;&gt;<br>
&gt;&gt; ------------------------------<br>
&gt;&gt; Please consider the environment before printing this email<br>
&gt;&gt; Warning: This electronic message together with any attachments is<br>
&gt;&gt; confidential. If you receive it in error: (i) you must not read, use,<br>
&gt;&gt; disclose, copy or retain it; (ii) please contact the sender immediately<br>
&gt;&gt; by<br>
&gt;&gt; reply email and then delete the emails.<br>
&gt;&gt; The views expressed in this email may not be those of Landcare Research<br>
&gt;&gt; New<br>
&gt;&gt; Zealand Limited. <a href="http://www.landcareresearch.co.nz" target="_blank">http://www.landcareresearch.co.nz</a><br>
&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; --<br>
&gt;&gt; Steven J. Baskauf, Ph.D., Senior Lecturer<br>
&gt;&gt; Vanderbilt University Dept. of Biological Sciences<br>
&gt;&gt;<br>
&gt;&gt; postal mail address:<br>
&gt;&gt; VU Station B 351634<br>
&gt;&gt; Nashville, TN  37235-1634,  U.S.A.<br>
&gt;&gt;<br>
&gt;&gt; delivery address:<br>
&gt;&gt; 2125 Stevenson Center<br>
&gt;&gt; 1161 21st Ave., S.<br>
&gt;&gt; Nashville, TN 37235<br>
&gt;&gt;<br>
&gt;&gt; office: 2128 Stevenson Center<br>
&gt;&gt; phone: <a href="tel:%28615%29%20343-4582" value="+16153434582">(615) 343-4582</a>,  fax: (615)<br>
</div>&gt;&gt; 343-6707<a href="http://bioimages.vanderbilt.edu" target="_blank">http://bioimages.vanderbilt.edu</a><br>
<div class="im">&gt;&gt;<br>
&gt;&gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; ------------------------------------------------------------------------------------<br>
&gt; Pete DeVries<br>
&gt; Department of Entomology<br>
&gt; University of Wisconsin - Madison<br>
&gt; 445 Russell Laboratories<br>
&gt; 1630 Linden Drive<br>
&gt; Madison, WI 53706<br>
&gt; Email: <a href="mailto:pdevries@wisc.edu">pdevries@wisc.edu</a><br>
</div>&gt; TaxonConcept &lt;<a href="http://www.taxonconcept.org/" target="_blank">http://www.taxonconcept.org/</a>&gt;  &amp;<br>
&gt; GeoSpecies&lt;<a href="http://about.geospecies.org/" target="_blank">http://about.geospecies.org/</a>&gt; Knowledge<br>
&gt; Bases<br>
&gt; A Semantic Web, Linked Open Data &lt;<a href="http://linkeddata.org/" target="_blank">http://linkeddata.org/</a>&gt;  Project<br>
&gt; --------------------------------------------------------------------------------------<br>
&gt; _______________________________________________<br>
&gt; tdwg-content mailing list<br>
<div class="im">&gt; <a href="mailto:tdwg-content@lists.tdwg.org">tdwg-content@lists.tdwg.org</a><br>
</div><div class="im">&gt; <a href="http://lists.tdwg.org/mailman/listinfo/tdwg-content" target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg-content</a><br>
&gt;<br>
<br>
<br>
<br>
</div>----------------------------------------------------------------------------<br>
David Remsen, Senior Programme Officer<br>
Electronic Catalog of Names of Known Organisms<br>
Global Biodiversity Information Facility Secretariat<br>
Universitetsparken 15, DK-2100 Copenhagen, Denmark<br>
Tel: <a href="tel:%2B45-35321472" value="+4535321472">+45-35321472</a>   Fax: <a href="tel:%2B45-35321480" value="+4535321480">+45-35321480</a><br>
Skype: dremsen<br>
----------------------------------------------------------------------------<br>
<br>
<br>
<br>
</blockquote></div><br><br clear="all"><br>-- <br>







------------------------------------------------------------------------------------<br>Pete DeVries<br>Department of Entomology<br>University of Wisconsin - Madison<br>445 Russell Laboratories<br>1630 Linden Drive<br>Madison, WI 53706<br>
Email: <a href="mailto:pdevries@wisc.edu" target="_blank">pdevries@wisc.edu</a><br><a href="http://www.taxonconcept.org/" target="_blank">TaxonConcept</a>  &amp;  <a href="http://about.geospecies.org/" target="_blank">GeoSpecies</a> Knowledge Bases<br>
A Semantic Web, <a href="http://linkeddata.org/" target="_blank">Linked Open Data</a>  Project<br>--------------------------------------------------------------------------------------<br>
</div>