<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7654.12">
<TITLE>Re: [tdwg-content] Producing a global taxon register (was: ITIS        TSNID to uBio NamebankIDs mapping)</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>Van: Richard Pyle [<A HREF="mailto:deepreef@bishopmuseum.org">mailto:deepreef@bishopmuseum.org</A>]<BR>
Verzonden: zo 5-6-2011 19:14<BR>
<BR>
&gt; * a GTR - global taxon register - is something else entirely, at least<BR>
&gt; if the term is taken literally. It would be indispensable if the purpose<BR>
&gt; &quot;to index all usages of all names in all sources&quot; is to be realized.<BR>
<BR>
Yes, that would be nice.&nbsp; But as Tony indicated, that would be impractical<BR>
for the foreseeable future.&nbsp; Especially when you consider that &quot;all sources&quot;<BR>
encompasses not only &quot;all publications&quot; (including popular books and<BR>
magazine articles, newspaper articles, etc., etc.), but also all unpublished<BR>
sources (museum specimen labels, field notebooks, personal correspondence,<BR>
etc., etc.).&nbsp; The GNUB model is designed to accommodate any &amp; all of these,<BR>
but a proactive attempt to populate it to that extent would represent an<BR>
unrealistic amount of effort.<BR>
<BR>
***<BR>
&nbsp;&nbsp;&nbsp;&nbsp; I don't know about that. Certainly, if you organize this top down<BR>
&nbsp;&nbsp;&nbsp;&nbsp; it would be a prohibitively massive undertaking. However, if<BR>
&nbsp;&nbsp;&nbsp;&nbsp; organized bottom up, it may be quite different; of course, coverage<BR>
&nbsp;&nbsp;&nbsp;&nbsp; would be uneven.<BR>
* * *<BR>
<BR>
However, an enormous benefit would be achieved it a select subset of &quot;all<BR>
usages of all names in all sources&quot; was targeted.&nbsp; For example, the first<BR>
priority for populating GNUB will be:<BR>
<BR>
&gt; a complete nomenclatural index<BR>
&gt; (inventorying all nomenclatural acts),<BR>
<BR>
***<BR>
&nbsp;&nbsp;&nbsp;&nbsp; This would not be a first step. The first step will be a complete<BR>
&nbsp;&nbsp;&nbsp;&nbsp; Checklist; likely, this will be ready years before a complete<BR>
&nbsp;&nbsp;&nbsp;&nbsp; nomenclatural index.<BR>
* * *<BR>
<BR>
And the next step would be:<BR>
<BR>
&gt; moving towards<BR>
&gt; lists of currently accepted names<BR>
<BR>
That is, capturing the specific usage instances for each that reflect a<BR>
modern taxonomic landscape.&nbsp; Of course, there is more than one<BR>
interpretation of the &quot;modern taxonomic landscape&quot; (i.e., different opinions<BR>
about how to structure the HCAL). Therefore, you need a spectrum of modern<BR>
usage instances to capture all of the popular HCAL perspectives.<BR>
<BR>
&gt; Names and taxa are quite different things and they are interconnected<BR>
&gt; in a complex way.<BR>
<BR>
I don't think that the interconnection is all that complex. In the same way<BR>
that nomenclature and biology intersect at the type specimen, names and taxa<BR>
intersect at the Taxon Name Usage instance.&nbsp; The analogy is reasonably good.<BR>
A scientific name is &quot;anchored&quot; to the biological world through the type<BR>
specimen. Likewise, a taxon concept is anchored to a name through a taxon<BR>
name usage instance.&nbsp; Not all taxon name usage instances rise to the level<BR>
of an explicit or implicit taxon concept definition.&nbsp; However, all taxon<BR>
concept definitions exist in the form of a Taxon Name Usage instance.<BR>
<BR>
The problem, as Tony alluded to, is that TNU instances are so abundant that<BR>
it can be overwhelming to contemplate the TNU universe in its entirety.<BR>
<BR>
***<BR>
&nbsp;&nbsp;&nbsp;&nbsp; Not so sure if it is handy to refer to this as a universe, given that<BR>
&nbsp;&nbsp;&nbsp;&nbsp; the components conflict, cluster, overlap, etc.<BR>
* * *<BR>
<BR>
Dave Remsen referred to TNUs as the &quot;individual molecules&quot; of taxonomy. When<BR>
we look at a physical object, we don't think of it in terms of an assemblage<BR>
of individual molecules; we abstract it to the entire object.&nbsp; This is why<BR>
we have so many databases that focus on the HCAL -- it's much more direct to<BR>
capture the entire object (in this case, taxon concept), than to enumerate<BR>
all of the molecules that comprise it.&nbsp;<BR>
<BR>
***<BR>
&nbsp;&nbsp;&nbsp;&nbsp; I agree that it is more direct, but its popularity will be because<BR>
&nbsp;&nbsp;&nbsp;&nbsp; of the popularity of shortcuts, the desire for the One Truth or the<BR>
&nbsp;&nbsp;&nbsp;&nbsp; Latest Thing, or just laziness.<BR>
* * *<BR>
<BR>
But unlike physical objects and their constituent molecules, there are<BR>
&quot;special&quot; TNUs that stand out from all the rest.&nbsp; Capturing a few of these<BR>
&quot;special&quot; TNUs will allow us to get most of the benefit in representing the<BR>
parts of the taxon concept we're interested.&nbsp; As already noted, these<BR>
&quot;special&quot; TNUs include all the relevant nomenclatural acts for all of the<BR>
names that have been associated with that taxon concept, as well as the main<BR>
concept definitions (e.g., published taxonomic treatments that may or may<BR>
not carry nomenclatural acts with them).&nbsp; In other words, unlike trying to<BR>
describe a physical object by enumerating its individual molecules, we can<BR>
capture the majority of our interest in taxon names and concepts by<BR>
enumerating only a small fraction of the TNUs (i.e., the aforementioned<BR>
&quot;special&quot; ones).<BR>
<BR>
***<BR>
&nbsp;&nbsp;&nbsp;&nbsp; Yes, the Law of Diminishing Returns applies. However, there are two<BR>
&nbsp;&nbsp;&nbsp;&nbsp; issues. Firstly, where to draw the line? Secondly, the marketing<BR>
&nbsp;&nbsp;&nbsp;&nbsp; pitch. Anything that will offer, say, a 40% usability will be marketed<BR>
&nbsp;&nbsp;&nbsp;&nbsp; as the Eighth Wonder of the World, and will cause further damage.<BR>
<BR>
Paul<BR>
<BR>
<BR>
</FONT>
</P>

</BODY>
</HTML>