<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">One further reason for centralisation (again, not "instead of" but "as well as") is consistency of metadata.<div><br></div><div>When I'm mapping specimen codes to GBIF I have one query interface and one return format. If I have to go to individual providers then all bets are off. Perhaps I'm lucky and the provider supports something like linked data, so I can figure out how to retrieve data (as opposed to a human-friendly web page). But instead I expect we will have all sorts of formats. For example, today I discovered records in GenBank that are linked to a tissue database with web pages like this:&nbsp;</div><div><br></div><div><a href="http://collections.nhm.ku.edu/KU_Tissue/detail.jsp?record=367">http://collections.nhm.ku.edu/KU_Tissue/detail.jsp?record=367</a> (from sequence&nbsp;<a href="http://www.ncbi.nlm.nih.gov/nuccore/FJ215165">http://www.ncbi.nlm.nih.gov/nuccore/FJ215165</a> )</div><div><br></div><div>So, I have to write code to scrape this page and get the bit I need (the voucher code). Really? In this day and age? On the one had it's great that this information exists, but if it's not computer readable then make it harder to integrate the data.</div><div><br></div><div>Even if we use standard vocabularies we can still have problems. BigDig found a whole range of different versions of Darwin Core in the wild (see&nbsp;<a href="http://bigdig.ecoforge.net/wiki/SchemaStatus">http://bigdig.ecoforge.net/wiki/SchemaStatus</a> ), and I suspect this is one of the sources of GBIF's problems (whoever decided that catalogNumber and&nbsp;catalogNumberText where a good idea has a lot to answer for).</div><div><br></div><div>This is one reason I argue that we want both centralisation and decentralisation.</div><div><br></div><div><div>Regards</div><div><br></div><div>Rod</div><div><br><div>
<span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; ">---------------------------------------------------------<br>Roderic Page<br>Professor of Taxonomy<br>Institute of Biodiversity, Animal Health and&nbsp;Comparative Medicine<br>College of Medical, Veterinary and Life&nbsp;Sciences<br>Graham Kerr Building<br>University of Glasgow<br>Glasgow G12 8QQ, UK<br><br>Email:&nbsp;<a href="mailto:r.page@bio.gla.ac.uk">r.page@bio.gla.ac.uk</a><br>Tel: +44 141 330 4778<br>Fax: +44 141 330 2792<br>AIM: <a href="mailto:rodpage1962@aim.com">rodpage1962@aim.com</a><br>Facebook:&nbsp;<a href="http://www.facebook.com/profile.php?id=1112517192">http://www.facebook.com/profile.php?id=1112517192</a><br>Twitter:&nbsp;<a href="http://twitter.com/rdmpage">http://twitter.com/rdmpage</a><br>Blog:&nbsp;<a href="http://iphylo.blogspot.com">http://iphylo.blogspot.com</a><br>Home page:&nbsp;<a href="http://taxonomy.zoology.gla.ac.uk/rod/rod.html">http://taxonomy.zoology.gla.ac.uk/rod/rod.html</a><br></span>
</div>
<br></div></div></body></html>