Hi Jim,<div><br></div><div>Thanks for keeping in good humor. :-)</div><div><br></div><div>I was trying to get my head around the TaxonOccurrence standard so I could rewrite my observation records,</div><div>and was hoping on finding some examples. That experience, and some related issues, made me a little irritable,</div>
<div>for that I am sorry.</div><div><br></div><div>It might be useful to make up a test set. It does not even need to be real. In my experience, this is where</div><div>you really start to see if the standard does what you want it to do. Many times I have thought that I had</div>
<div>everything figured out, only to discover after loading data into my triple store that something will not work</div><div>or something that used to work was now broken by the addition of a new feature.</div><div><br></div>
<div>I am not bothered by the idea of branding, it just seemed that the it was being confused with the goal of</div><div>persistence in what seemed to be a unproductive thread.</div><div><br></div><div>Thanks again for being amused, tolerant and insightful. :-)</div>
<div><br></div><div>- Pete</div><div><br></div><div><br></div><div><div class="gmail_quote">On Thu, Apr 23, 2009 at 7:50 PM, Jim Croft <span dir="ltr">&lt;<a href="mailto:jim.croft@gmail.com">jim.croft@gmail.com</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Can&#39;t let this great opportunity pass...  :)<br>
It is not just us.  It is the regrettable human condition.  See also:<br>
<a href="http://www.informationweek.com/news/infrastructure/management/showArticle.jhtml?articleID=216600011" target="_blank">http://www.informationweek.com/news/infrastructure/management/showArticle.jhtml?articleID=216600011</a><br>

One of the intriguing and enigmatic things about TDWG is that it does<br>
not seem to respect its own standards, preferring to invent another<br>
set rather than fix or enhance what is already there.  More than the<br>
&#39;not invented here&#39; syndrome, we have to deal with &#39;not invented here<br>
this week&#39; and the user is left with the impression of a happy<br>
self-absorbed group chasing a flock of flitting butterflies - &#39;oh,<br>
that&#39;s pretty, I will try and catch that one&#39;.  Yep, just the human<br>
condition.  In another context, Roger H,<br>
<a href="http://www.hyam.net/blog/archives/346" target="_blank">http://www.hyam.net/blog/archives/346</a>, has provided the best<br>
description of TDWG and its standards I think I have ever heard: &quot;It<br>
is kind of like the guy selling seagulls on the beach. You give him £5<br>
and he points into the sky and says &#39;That one is yours&#39;. Yes he is<br>
providing a service but the relationship that counts is the one<br>
between you and the gull.&quot;  This is both profound and frightening in<br>
how close it is to reality.<br>
On the complexity and costs of implementation, you are absolutely<br>
right.  Taxonomic database standards have moved out of the domain of<br>
taxonomists, they no longer understand what we are talking about<br>
(hell, I no longer understand what we are talking about.  And the rest<br>
of you?  c&#39;mon now, be honest... :) and we are left with this<br>
relationship of &#39;trust us&#39; paternalism that I do not think is all that<br>
healthy - we all trust and respect Microsoft, right?. It is getting<br>
increasingly difficult give advice to a bod with a beat up PC in a<br>
developing country on what they should do - the alphabet soup<br>
surrounding GUIDS and the like just does not cut it when the mind set<br>
is an Excel spreadsheet with a bunch of intuitive headings.  Oh, I&#39;m<br>
sorry - you mean it is not just in developing countries?  There is a<br>
widening gap between &#39;Joe the Taxonomist&#39; and business of taxonomy<br>
data standards that we do not seem to be able to address (do we even<br>
care?).  We used to be able to give our staff in the herbarium a TDWG<br>
standard and say &#39;this is what we have to do.&#39;  Not anymore...  Ah,<br>
the good ole days...  Maybe the answer lies in the hegemony of a new<br>
and benevolent  &#39;MSOffice for Taxonomy&#39;.  Could work, but I do not<br>
think it is going to be particularly satisfying.<br>
On the reuse issue, Greg W argues that we do not do nearly enough of<br>
this and I agree with him.  He argues that TDWG should focus on the<br>
standard and not the application and implementation of the standard<br>
and has proposed that in our vocabularies we should adopt the<br>
principles of nomenclatural priority, that is, going back to *Dublin*<br>
Core, adding stuff chronologically from other other standards,<br>
including our own, until there is no option other than to invent<br>
another one, or there is nothing in our domain left to standardize.<br>
For taxonomists there is something inherently attractive in this<br>
approach - don&#39;t describe a taxon where it already exists, don&#39;t<br>
invent a standard where one already exists.  To retrofit this and<br>
untangle all the synonymy and homonymy in our existing standards and<br>
implementations is going to take a lot of work though.  But the<br>
vocabularies and ontologies are a good start.<br>
On the &#39;branding, issue, it is not so much branding but attribution.<br>
Apart from the moral and legal issues, it is unscientific not to<br>
attribute, source and provide lineage for data.  The is no<br>
optionality.  We have to do it.  Even if the initial supplier<br>
&#39;disappears&#39;.  *Especially* if the initial supplier disappears.<br>
Attribution (branding if you like) is absolutely essential for<br>
credibility.  If someone is not going to do it, they can not have our<br>
data, and we will not use theirs.<br>
On the architectural issue, I can not really get all that hung up on<br>
it.  If a standard is good, it should be able to be implemented in a<br>
number of architectures (isn&#39;t that almost a definition of<br>
interoperability?).  Where things get &#39;interesting&#39; is when<br>
architecture (and the continuum towards application) becomes the<br>
standard or part of the standard.  TDWG needs to constantly ask itself<br>
to what extent it needs to get involved with implementation of the<br>
standards it promotes.  I would argue &#39;not at all&#39;, but this is<br>
another discussion.<br>
And the &#39;insider&#39; cabalistic nature of TDWG?   What can I say - it has<br>
always been this way.  A standard attracts a champion and the champion<br>
establishes a fiefdom of acolytes around it.  Yep, the human<br>
condition.  And it sort of works.  Some of the time.  (btw - another<br>
artifact of the human condition - your brilliant ideas are never<br>
perceived as such until someone else has them - just ask poor old<br>
Wallace how he is feeling this year).  A downside of this approach is<br>
that the various TDWG standards are very poorly coordinated between<br>
each other - this is something we should be able to do something<br>
We could piss on the TDWG tent from the outside, but you have to<br>
agree, it is much more satisfying to get inside the tent and piss on<br>
and piss off everyone in it...  :)<br>
&lt;disclaimer&gt;None of the above ideas are mine.  I am following the TDWG<br>
standard practice of restating them without attribution :)<br>
Ah... that was fun...<br>
<div><div></div><div class="h5"><br>
On Fri, Apr 24, 2009 at 5:09 AM, Peter DeVries &lt;<a href="mailto:pete.devries@gmail.com">pete.devries@gmail.com</a>&gt; wrote:<br>
&gt; Respectfully,<br>
&gt; 1) Only certain classes of organizations will be able to contribute since<br>
&gt; the standard is requires special skills. Those groups that can pay for<br>
&gt; hardware and<br>
&gt;     a person specific to this standard for perpetuity. I look at this and<br>
&gt; think that a number of groups that could be providers cannot because of the<br>
&gt; way the<br>
&gt;     system is implemented. Why not have a simple RDF tar or zip file format<br>
&gt; that GBIF checks with a crawler every night?<br>
&gt; 2) There is very little reuse of existing vocabularies, geo for instance.<br>
&gt; Similar to the &quot;not invented here mentality&quot;.<br>
&gt; 3) Discussions and decisions seem to be too much about making sure that<br>
&gt; providers keep their &quot;brand&quot; on the data even if they disappear.<br>
&gt; 4) Suggestions or alternative ways of thinking are rejected until an insider<br>
&gt; restates them without attribution<br>
&gt; 5) It is not at all clear how some of these decisions are made. It appears<br>
&gt; as if some people disagree, there is discussion. Then years later there is<br>
&gt;     the same discussion. It seems that some smaller group keeps pulling<br>
&gt; everyone back to the same architectural decision.<br>
&gt; 6) Where are the example data sets? We should have some example data sets<br>
&gt; available to see if the standard can be used to answer real questions?<br>
&gt;     Either they don&#39;t exist or they are only available to a few.<br>
&gt; I actually have nothing but praise for GBIF and uBio (except for the minor<br>
&gt; encoding thing), this more about trying to work within TDWG and getting<br>
&gt; stonewalled. I am having the same feelings about it that I had a few years<br>
&gt; ago, after which I left to try to make something that worked so I could<br>
&gt; proceed with my project.<br>
&gt; It probably was unfair to imply that the fiefdoms are by design, rather than<br>
&gt; a side effect of the implementation standards, and for that I apologize.<br>
&gt; - Pete<br>
&gt; On Thu, Apr 23, 2009 at 10:56 AM, Bob Morris &lt;<a href="mailto:morris.bob@gmail.com">morris.bob@gmail.com</a>&gt; wrote:<br>
&gt;&gt; &quot;described by anyone&quot; is not the same as &quot;described by anyone in any way<br>
&gt;&gt; convenient to the describer&quot;, so I find this quotation somewhat<br>
&gt;&gt; disingenuous. More precisely, I wonder what TDWG standard or proposed<br>
&gt;&gt; standard you find enables fiefdoms \in ways that are impossible under some<br>
&gt;&gt; other solution to the problem the standard addresses/.<br>
&gt;&gt; Bob Morris<br>
&gt;&gt; On Thu, Apr 23, 2009 at 10:47 AM, Peter DeVries &lt;<a href="mailto:pete.devries@gmail.com">pete.devries@gmail.com</a>&gt;<br>
&gt;&gt; wrote:<br>
&gt;&gt;&gt; This paragraph below seems to encapsulate the differences in thinking<br>
&gt;&gt;&gt; between the linkeddata community and<br>
&gt;&gt;&gt; some of the TDWG people on how to best share biodiversity data.<br>
&gt;&gt;&gt; &quot;The notion of a fabric of resources that are individually described,<br>
&gt;&gt;&gt; queried, and resolved may seem unmanageable or like science fiction. For<br>
&gt;&gt;&gt; organizations that are used to large, manual, centralized efforts to<br>
&gt;&gt;&gt; standardize on everything, it may seem anarchic to allow resources to grow<br>
&gt;&gt;&gt; organically and be described by anyone. The same people would probably not<br>
&gt;&gt;&gt; believe the Web possible in the first place if there were not already ample<br>
&gt;&gt;&gt; proof of its success.&quot;<br>
&gt;&gt;&gt; REST for Java developers, Part 4: The future is RESTful<br>
&gt;&gt;&gt; From <a href="http://www.javaworld.com/javaworld/jw-04-2009/jw-04-rest-series-4.html?page=4" target="_blank">http://www.javaworld.com/javaworld/jw-04-2009/jw-04-rest-series-4.html?page=4</a><br>
&gt;&gt;&gt; I think that some people may have lost sight of the goal of making data<br>
&gt;&gt;&gt; available to improve the understanding of our<br>
&gt;&gt;&gt; natural world and hopefully better manage our natural resources.<br>
&gt;&gt;&gt; It does not seem that creating a distributed network of fiefdoms will<br>
&gt;&gt;&gt; help us achieve this goal.<br>
&gt;&gt;&gt; - Pete<br>
&gt;&gt;&gt; I was led to this article by @janzemanek on twitter.<br>
