<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 6.5.7654.12">
<TITLE>RE: [tdwg-content] GUIDs for publications (usages and names)</TITLE>
</HEAD>
<BODY>
<!-- Converted from text/plain format -->

<P><FONT SIZE=2>And following on re: DOIs, BHL has become a member of CrossRef and starting in February will begin assigning DOIs first to our monographs &amp; then on to journal content.&nbsp; There is an annual fee for membership and then a fee for every DOI assigned.&nbsp; BHL is absorbing these costs for community benefit.<BR>
<BR>
Chris<BR>
<BR>
-----Original Message-----<BR>
From: tdwg-content-bounces@lists.tdwg.org on behalf of Roderic Page<BR>
Sent: Wed 1/5/2011 2:17 AM<BR>
To: tdwg-content@lists.tdwg.org<BR>
Cc: Paul Murray; Chris Freeland<BR>
Subject: Re: [tdwg-content] GUIDs for publications (usages and names)<BR>
<BR>
Few quick comments on this thread.<BR>
<BR>
DOIs<BR>
----<BR>
<BR>
CrossRef provides an OpenURL resolver for discovering whether a DOI&nbsp;<BR>
exists for a publication. This is how publishers find DOIs for&nbsp;<BR>
references cited in manuscripts, and several bibliographic tools use&nbsp;<BR>
it to populate their databases (e.g., Zotero, Mendeley). I provide a&nbsp;<BR>
wrapper to this resolver at <A HREF="http://bioguid.info/openurl">http://bioguid.info/openurl</A>.<BR>
<BR>
The number of taxonomic works with DOIs is growing, and may be rather&nbsp;<BR>
larger than most people realise, especially as publishers such as&nbsp;<BR>
Wiley's digitise archives of society journals, and as JSTOR increases&nbsp;<BR>
its content. Add yes, CSIRO uses DOIs.<BR>
<BR>
The &quot;brief citations&quot; Tony mentions, which are widely used by&nbsp;<BR>
nomenclators, do pose problems for services such as CrossRef. I&nbsp;<BR>
discuss one approach to solving this in my paper &quot;bioGUID: resolving,&nbsp;<BR>
discovering, and minting identifiers for biodiversity informatics&quot; (<A HREF="http://dx.doi.org/10.1186/1471-2105-10-S14-S5">http://dx.doi.org/10.1186/1471-2105-10-S14-S5</A><BR>
&nbsp; ), where I describe a service that takes a page within a reference&nbsp;<BR>
and tries to locate the DOI for the enclosing paper. I'm using this&nbsp;<BR>
service at the moment to find papers in the recently released Plant&nbsp;<BR>
List.<BR>
<BR>
OCLC<BR>
----<BR>
<BR>
Paul mentions <A HREF="http://www.worldcat.org">http://www.worldcat.org</A>, which is a great resource,&nbsp;<BR>
albeit riddled with duplicates (although the library world has its own&nbsp;<BR>
notion of what counts as a duplicate). BHL content is now appearing in&nbsp;<BR>
OCLC.<BR>
<BR>
CiteBank<BR>
--------<BR>
<BR>
As Steve points out, we're going to need a large community effort to&nbsp;<BR>
assemble a bibliography of all taxonomic work. Without wishing to side&nbsp;<BR>
track this thread, I think this is a task best undertaken with a much&nbsp;<BR>
larger community than we traditionally think of. The bibliographic&nbsp;<BR>
site Mendeley or something similar, such as Zotero, seem better bets&nbsp;<BR>
than doing this ourselves.<BR>
<BR>
Linked Data<BR>
-----------<BR>
<BR>
Without wishing to get too bogged down in a discussion of linked data,&nbsp;<BR>
perhaps a few points are worth noting.<BR>
<BR>
1. Although DOIs currently don't play nice with linked data (unless&nbsp;<BR>
wrapped in a service such as <A HREF="http://bioguid">http://bioguid</A>), according to Geoff&nbsp;<BR>
Bilder, CrossRef has plans to add content negotiation and RDF to <A HREF="http://dx.doi.org">http://dx.doi.org</A><BR>
, and is close to flicking the switch to make this happen.<BR>
<BR>
2. The bulk of linked data resources for biology are not provided by&nbsp;<BR>
the primary data sources (e.g., GenBank or PubMed) but by third party&nbsp;<BR>
wrappers around those services. These services have made choices about&nbsp;<BR>
URIs, vocabularies that might not hold if and when the primary data&nbsp;<BR>
providers, such as NCBI, start serving RDF. In my experience these&nbsp;<BR>
third party services may also omit things that we may think of as&nbsp;<BR>
vital, for example <A HREF="http://bio2rdf.org">http://bio2rdf.org</A> doesn't include specimen or&nbsp;<BR>
locality information for GenBank sequences.<BR>
<BR>
3. For many resources we either have no linked data URIs or too many.&nbsp;<BR>
This either leads to somebody having to mint URIs, typically for&nbsp;<BR>
something that isn't their own data (e.g., I provide HTTP URIs for&nbsp;<BR>
ISSNs), or having to accommodate multiple URIs, which makes specifying&nbsp;<BR>
relationships between objects rather tricky (one database may describe&nbsp;<BR>
a citation link between two documents using PubMed identifiers, while&nbsp;<BR>
another describes the same link using DOIs).<BR>
<BR>
My point is that linked data isn't a panacea, in some respects it just&nbsp;<BR>
makes the mess we're in easier to see. The hope of the linked data&nbsp;<BR>
community is that eventually it will all come together. For an&nbsp;<BR>
alternative take on this I recommend Stefano Mazzocchi's essay &quot;On&nbsp;<BR>
Data Reconciliation Strategies and Their Impact on the Web of Data&quot; <A HREF="http://www.betaversion.org/~stefano/linotype/news/304/">http://www.betaversion.org/~stefano/linotype/news/304/</A><BR>
<BR>
Regards<BR>
<BR>
Rod<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
---------------------------------------------------------<BR>
Roderic Page<BR>
Professor of Taxonomy<BR>
Institute of Biodiversity, Animal Health and Comparative Medicine<BR>
College of Medical, Veterinary and Life Sciences<BR>
Graham Kerr Building<BR>
University of Glasgow<BR>
Glasgow G12 8QQ, UK<BR>
<BR>
Email: r.page@bio.gla.ac.uk<BR>
Tel: +44 141 330 4778<BR>
Fax: +44 141 330 2792<BR>
AIM: rodpage1962@aim.com<BR>
Facebook: <A HREF="http://www.facebook.com/profile.php?id=1112517192">http://www.facebook.com/profile.php?id=1112517192</A><BR>
Twitter: <A HREF="http://twitter.com/rdmpage">http://twitter.com/rdmpage</A><BR>
Blog: <A HREF="http://iphylo.blogspot.com">http://iphylo.blogspot.com</A><BR>
Home page: <A HREF="http://taxonomy.zoology.gla.ac.uk/rod/rod.html">http://taxonomy.zoology.gla.ac.uk/rod/rod.html</A><BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
<BR>
_______________________________________________<BR>
tdwg-content mailing list<BR>
tdwg-content@lists.tdwg.org<BR>
<A HREF="http://lists.tdwg.org/mailman/listinfo/tdwg-content">http://lists.tdwg.org/mailman/listinfo/tdwg-content</A><BR>
<BR>
</FONT>
</P>

</BODY>
</HTML>