Validome Weblog
24.10.2007URI-Check und URL-Patente
Die zuverlässige Überprüfung von URIs innerhalb von Dokumenten ist ein immer noch zu lösendes Problem. Im Rahmen einer aktuellen Diskussion innerhalb der W3C-Mailingliste, verweist Frank Ellermann auf die Dringlichkeit einer zuverlässigen URI-Verifikation.
Aktueller Anlass der Diskussion war die mangelhafte Validierungsaussage bekannter Validatoren in Bezug auf die Spezifikationskonformität einer URI in Dokumenten. Diese sind in der RFC3986 geregelt, allerdings finden die Spezifikationen bisher kaum Beachtung, was ihre korrekte Implementierung in Validierungsdiensten angeht. Frank Ellermann hatte am vergangenen Wochenende darauf aufmerksam gemacht, in diesem Fall ging es um das Vorhandensein ungültiger ASCII-Zeichen in URIs. Das Problem wurde von keinem bekannten Validator erkannt, was möglicherweise Tür und Tor für Installation und Start potentieller Malware durch den Klick auf eine (böswillig) präparierte URI in Browsern öffnen könnte. Validome hat bisher einen URI-Check lediglich im Rahmen seiner Schema-Validierung durchgeführt, allerdings erweist sich diese Vorgehensweise am oben genannten Beispiel als weitestgehend unzureichend. Da eine Schema-Validierung nur im Zusammenang mit XHTML-Dokumenten in Frage kommt, derartige URI-Probleme allerdings auch in HTML-Dokumenten auftreten können, ist hier eine zuverlässige URI-Verifikation (nicht nur in XHTML-Dokumenten) gefragt. Zum Thema "URI" gibt es auch ein weiteres Kapitel aus der Abteilung unsinnige Patente und Erfolg trotz Trivialität und Ignoranz: Beteiligt ist einmal wieder Amazon, der Internethändler (bzw. sein technischer Arm, A9.com) hat ein Patent erhalten, in dem das Hinzufügen eines Suchstrings am Ende einer URL als technische Innovation gefeiert wird. The search string may consist of a single search term, or a plurality of search terms separated by spaces. For example, a user wishing to search for "San Francisco Hotels" may do by simply accessing the URL "www.domain_name/San Francisco Hotels", where domain_name is a domain name associated with the web site system. The system may also support the use of Boolean operators and/or other types of operators within the search strings. In one embodiment, when the system receives a request for a URL of the form "www.domain_name/char_string", where char_string is a character string that may include spaces and non-alphabetic characters, the system initially determines whether the character string includes a prefix that identifies the URL as a non-search-request URL. Zwei Anmerkungen zum URL-Patent: Abgesehen von der Trivialität und eindeutig vorhandener Prior Art in der Sache, scheint sich Amazon auch reichlich wenig mit den besagten URI- bzw. URL-Spezifikationen auszukennen - "spaces" innerhalb von URLs erfüllen nicht unbedingt den angedachten Zweck...:-)))))) |
NewsbereicheSchnellsucheSchnellauswahl
ArchiveAlternative Feeds |
|||||||||||||||||||||||||||||||||||||||||||||||||

RSS 0.91 feed