<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">David,<div><br></div><div>You might like to use the GBIF vocabulary server. &nbsp;It has a multi-lingual country name thesaurus based on ISO 3166 and has over 23K terms for 226 ISO countries. &nbsp;You can download the data or use the service. &nbsp;It may have some lexical variants and misspellings. &nbsp;You can also get an account and add any you might know of. &nbsp; And all presented to you in your old friend Drupal. &nbsp;Perhaps you might like to serve as curator. &nbsp;Maybe? &nbsp;Diamond in the rough here, I'm sure of it.<br><div><br></div><div><a href="http://vocabularies.gbif.org/vocabularies/country">http://vocabularies.gbif.org/vocabularies/country</a></div><div><br></div><div>Best,</div><div>Dave</div><div><br><div>
<span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; font-size: 12px; "><span class="Apple-style-span" style="border-collapse: separate; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; -webkit-text-decorations-in-effect: none; text-indent: 0px; -webkit-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; "><span class="Apple-style-span" style="border-collapse: separate; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; -webkit-text-decorations-in-effect: none; text-indent: 0px; -webkit-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><span class="Apple-style-span" style="border-collapse: separate; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; -webkit-text-decorations-in-effect: none; text-indent: 0px; -webkit-text-size-adjust: auto; text-transform: none; orphans: 2; white-space: normal; widows: 2; word-spacing: 0px; "><div><div>----------------------------------------------------------------------------</div><div>David Remsen</div><div>Global Biodiversity Information Facility Secretariat</div><div>Universitetsparken 15, DK-2100 Copenhagen, Denmark</div><div>Tel: +1 508 289 7477 &nbsp; Fax: +1 508 289 7900</div><div>Mobile +1 508 274 4055</div><div>Skype: dremsen</div><div>----------------------------------------------------------------------------</div><div><br></div></div></span></span></span></div></span></div><br class="Apple-interchange-newline"></div></div></span><br class="Apple-interchange-newline"></span><br class="Apple-interchange-newline">
</div>
<br><div><div>On May 17, 2013, at 10:39 AM, Matt Jones wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div dir="ltr">A good official list of countries is available from the Library of Congress:<div>&nbsp;&nbsp;<a href="http://www.loc.gov/standards/codelists/countries.xml">http://www.loc.gov/standards/codelists/countries.xml</a></div>
<div style="">&nbsp; For background, see:&nbsp;<a href="http://www.loc.gov/marc/countries/">http://www.loc.gov/marc/countries/</a></div><div style=""><br></div><div style="">And of course there's ISO 3166, the list of country codes:</div>
<div style="">&nbsp; <a href="http://www.iso.org/iso/home/standards/country_codes/country_names_and_code_elements_xml.htm">http://www.iso.org/iso/home/standards/country_codes/country_names_and_code_elements_xml.htm</a></div><div style="">
&nbsp; <a href="http://www.iso.org/iso/country_codes">http://www.iso.org/iso/country_codes</a><br></div><div style=""><br></div><div style="">Not sure about the alternate representations and misspellings, though.</div><div style=""><br>
</div><div style="">Matt</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Fri, May 17, 2013 at 5:57 AM, Shorthouse, David <span dir="ltr">&lt;<a href="mailto:davidpshorthouse@gmail.com" target="_blank">davidpshorthouse@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Folks,<br>
<br>
The Canadensys development team, <a href="http://www.canadensys.net/" target="_blank">http://www.canadensys.net</a> is looking<br>
for efficient, low-maintenance ways to validate and reconcile data in<br>
its National cache of occurrence data. We are working on a Java<br>
library to initially tackle single-field Darwin Core validations,<br>
<a href="https://github.com/Canadensys/narwhal-processor" target="_blank">https://github.com/Canadensys/narwhal-processor</a>. We hope this library<br>
is sufficiently generalized for uses outside our project.<br>
<br>
Our current challenge is to reconcile country names, which requires<br>
access to an up-to-date, well-maintained knowledge base of country<br>
names, their alternative representations (possibly multilingual), and<br>
mappings to known misspellings. For performance reasons, we'd like<br>
this thesaurus to be embedded in the library, but with the capacity to<br>
be periodically refreshed with data pulled from external resources<br>
such as <a href="http://dbpedia.org/" target="_blank">dbpedia.org</a>. This clearly has ties to semantic web thinking<br>
and, because we're new to the tools and services in this space, we'd<br>
like to solicit pointers and feedback such that we build this part of<br>
our library with maximal benefit to other projects. We started<br>
collecting thoughts here:<br>
<a href="https://github.com/Canadensys/narwhal-processor/issues/14" target="_blank">https://github.com/Canadensys/narwhal-processor/issues/14</a>.<br>
<br>
Cheers,<br>
<br>
David P. Shorthouse<br>
Christian Gendreau<br>
_______________________________________________<br>
tdwg mailing list<br>
<a href="mailto:tdwg@lists.tdwg.org">tdwg@lists.tdwg.org</a><br>
<a href="http://lists.tdwg.org/mailman/listinfo/tdwg" target="_blank">http://lists.tdwg.org/mailman/listinfo/tdwg</a><br>
</blockquote></div><br></div>
_______________________________________________<br>tdwg mailing list<br><a href="mailto:tdwg@lists.tdwg.org">tdwg@lists.tdwg.org</a><br>http://lists.tdwg.org/mailman/listinfo/tdwg<br></blockquote></div><br></div></div></body></html>