Startseite

Netz-Tipp-Studie

Suche
Startseite
Buchhandel
Bibliothek
Zeitung
Literatur
Kinder
Schule
Nützliches
Suchmaschinen
Bücherschau
Kostenloser Newsletter.

Bitte tragen Sie hier Ihre E-Mail-Adresse ein!

Systematisch gegliederter, umfangreicher Katalog Stöbern im Katalog        

Das Internet spricht Englisch ... und neuerdings auch Deutsch

Sprachen und ihre Verbreitung im World-Wide-Web

Zusammenfassung

Eins ist unumstritten, nach wie vor, Englisch ist die im Internet am meisten verbreitete Sprache. Für alle weiteren Angaben haben bislang die Zahlen gefehlt, viele beruhten auf Spekulationen.

www.netz-tipp.de präsentiert eine neue Statistik, auf der Basis von 2 Milliarden Webseiten. Aus ihr ergibt sich: Andere Sprachen gewinnen zunehmend an Bedeutung. Und die "Zweitsprache" des Internets ist offensichtlich Deutsch.

Mehr als jede zweite Webseite (56,4%) ist auf Englisch verfasst. Danach folgen Inhalte auf Deutsch (7,7%), auf Französisch (5,6%), auf Japanisch (4,9%) und Spanisch (3%). Damit ist Japanisch von Deutsch und Französisch vom zweiten auf den vierten Platz verdrängt worden.

So hoch die Dominanz des Englischen auch erscheint, so wird im historischen Vergleich doch der Wandel deutlich: Noch 1997 bestand das World Wide Web zu über 80 % aus Inhalten in englischer Sprache.

Betrachtet man lediglich Webseiten im erst seit neuerer Zeit gebräuchlichen PDF-Format, wird der Umbruch noch klarer: Hier beträgt der Anteil englischsprachiger Seiten nur noch 38,2%, es folgen Deutsch (10,6%), Französisch (8,8%), Japanisch (7,4%) und Spanisch (5,8%).

Der Grund für die Entwicklung: Das Angebot folgt offensichtlich der Nachfrage. Es wächst darum nicht nur die Zahl der Seiten aus nicht englischsprachigen Ländern, sondern es werden auch ursprünglich englische Inhalte zunehmend zusätzlich in anderen Sprachen angeboten. Die weltweit führende Suchmaschine Google zum Beispiel bietet ihre Dienste zur Zeit in 82 Sprachen an. Mit Erfolg: Die Nutzung der französischen Abfrage stieg innerhalb eines halben Jahres um ein Fünftel von 4% auf 5%, die der deutschen Abfrage sogar um ein Drittel von 9% auf 12%.

Es wird somit immer mehr zu einem Kriterium der Brauchbarkeit ("usability"), Inhalte in der Sprache des Zielpublikums anzubieten, was für die Zukunft eine Verstärkung des Trends zur Vielsprachigkeit vermuten lässt.

Sprachen im Internet

Methode

Fehlerquellen

Ältere Statistiken

Aktuelle Statistik - Sprachen im Internet 2002

Prognose: Die Sprachen der Nutzer

Schluss: Usability oder Brauchbarkeit

Methode

Zur Untersuchung der Sprachanteile haben wir die Fähigkeit einiger Suchmaschinen zur Spracherkennung genutzt. Hier kamen insbesondere Google und Alltheweb in Frage, da sie den größten Datenbestand erfasst haben.

Da Google eine leere Anfrage (Suche ohne Suchwort, die Auskunft gibt über die Größe des Datenbestands) nicht zulässt, wurde für die allgemeine Untersuchung auf Alltheweb zurückgegriffen. Es wurde eine Suche mit eingeschaltetem Sprachfilter für die jeweilige Sprache aber leerem Suchfeld vorgenommen.

Die Analyse der pdf-Dateien jedoch erfolgte, da dies technisch möglich war und um nicht nur auf den Bestand einer Suchmaschine zurückzugreifen, mit Google. Da nahezu jede pdf-Datei im Dateinamen die Endung "pdf" enthält, ergibt eine Stichwortsuche (in pdf-Dateien nach dem Stichwort "pdf") ein recht vollständiges Ergebnis.

Fehlerquellen

Die Ergebnisse können nur so gut sein, wie die Fähigkeiten der Suchmaschine, die Sprache einer Seite richtig zu identifizieren.

Insbesondere deutschsprachige Seiten enthalten sehr oft englische Begriffe. Als englischsprachig werden daher manchmal Seiten indentifiziert, auf denen sich Ausdrücke wie "tell a friend", "callback", "sitemap", "support" usw. häufen, die aber davon abgesehen in deutscher Sprache verfasst sind.

Die Suche nach scheinbar englischsprachigen Texten, in denen die Stichwörter "und + sind + auch" enthalten sind, lieferte 603.515 Treffer.

Zur Feststellung der Genauigkeit der Ergebnisse wurde die Suche nach diesen Stichworten mit dem Filter "Deutsch" und dem Filter "in allen Sprachen" vorgenommen. Ebenso für Englisch (Stichworte: "and + are + too") und Französisch ("et + sont + aussi").

Daraus ergaben sich folgende Fehlerquoten:
Deutsch 7,8%, Englisch 5,5%, Französisch 3,0%.

Der Anteil der deutschsprachigen Inhalte im Internet könnte demnach bei bis zu 8,3% (statt 7,7%) liegen, je nachdem wo man die Grenze zieht, was noch Deutsch ist oder schon Englisch. Wir haben jedoch keine Korrektur vorgenommen, die willkürlich wäre, sondern es bei der von Suchmaschine vorgenommenen Sprachzuordnung belassen.

Desweiteren sind natürlich nicht alle Seiten des Internets von Alltheweb (oder anderen Suchmaschinen) indiziert. Die Schätzungen über die tatsächliche Größe des Internets gehen daher weit auseinander. Es spricht aber wenig dafür, dass die sprachliche Verteilung in nicht-indizierten (aber öffentlich zugänglichen) Seiten wesentlich anders ist als in indizierten.

Seiten, die nicht öffentlich zugänglich sind, sind naturgemäß auch nicht erfasst und nicht Gegenstand der Untersuchung.

Ältere Statistiken

Die erste uns bekannte Untersuchung zu den Sprachanteilen im Internet wurde 1997 von der kanadischen Gesellschaft Alis Technologies erstellt. (http://alis.isoc.org/palmares.en.html). Danach ergaben sich folgende Anteile:

Englisch 82,3%, Deutsch 4,0%, Japanisch 1,6%, Französisch 1,5%, Spanisch 1,1%, andere 9,5%

Eine weitere Statistik wird häufiger zitiert. Sie dürfte aus dem Jahre 2001 stammen und basiert angeblich auf 313 Millionen Webseiten. Zur Methode lassen sich keine Angaben finden. (Vilaweb, zitiert nach global-reach.biz, dort widerum zitiert nach emarkter.com. http://www.global-reach.biz/globstats/refs.php3#overlap).

Hier ergeben sich folgende Anteile:

Englisch 68.4%, Japanisch 5.9%, Deutsch 5.8%, Chinesisch 3.9%, Französisch 3.0% Spanisch 2.4%, Russisch 1.9%, Italienisch 1.6%, Portugiesisch 1.4%, Koreanisch 1.3%, Andere 4.6%.

Aktuelle Statistik - Sprachen und ihre Verbreitung im Internet 2002

Sprachen der Internet-Inhalte 2002
(Webseiten in Millionen)

Englisch 1142,5 56,4%
Deutsch 156,2 7,7%
Französisch 113,1 5,6%
Japanisch 98,3 4,9%
Spanisch 59,9 3,0%
Chinesisch 48,2 2,4%
Italienisch 41,1 2,0%
Niederländisch 38,8 1,9%
Russisch 33,7 1,7%
Koreanisch 30,8 1,5%
Portugiesisch 29,4 1,5%
Schwedisch 15,1 0,7%
Polnisch 14,8 0,7%
Dänisch 12,3 0,6%
Tschechisch 11,5 0,6%
Türkisch 4,9 0,2%
Ungarisch 4,1 0,2%
Griechisch 2,0 0,1%
Sonstige 168,0 8,3%
Summe 2024,7 100,0%

Webseiten im PDF-Format
(in Millionen)

Englisch 4,77 38,17%
Deutsch 1,33 10,64%
Französisch 1,10 8,80%
Japanisch 0,93 7,41%
Spanisch 0,73 5,81%
Italienisch 0,46 3,64%
Schwedisch 0,46 3,64%
Ungarisch 0,45 3,56%
Chinesisch 0,28 2,22%
Türkisch 0,27 2,18%
Niederländisch 0,26 2,10%
Portugiesisch 0,25 1,99%
Tschechisch 0,22 1,78%
Griechisch 0,21 1,69%
Dänisch 0,19 1,53%
Russisch 0,10 0,83%
Polnisch 0,08 0,66%
Koreanisch 0,05 0,42%
Sonstige* 0,36 2,91%
Gesamt* 12,50 100%

* geschätzt

Prognose: Die Sprachen der Nutzer

Der Nutzer des Internets kann nicht immer entscheiden, in welcher Sprache er Inhalte annimmt. Häufig werden Inhalte nur in einer Sprache angeboten, und es ist natürlich nicht immer möglich und sinnvoll, jeden Text in mehrere Sprachen zu übersetzen.

Bei der Suchmaschine Google ist es dem Nutzer möglich, selbst eine Sprache auszuwählen, in der Oberfläche und Suchergebnisse präsentiert werden.

Eine Statistik von Google gibt daher einen Einblick in die sprachlichen Präferenzen und ihre Tendenz. Auch diese Zahlen lassen vermuten, dass sich der Anteil nicht-englischsprachiger Inhalte in Zukunft erheblich steigern wird.

Die sprachliche Präferenz der Google-Nutzer Januar 2002 (in Klammern: Juni 2001):

Englisch 57% (64%)
Deutsch 12% (9%)
Japanisch 7% (8%)
Spanisch 6% (5%)
Französisch 5% (4%)
Chinesisch 3% (1%)
Italienisch 2% (2%)
Andere 8% (4%)

Quelle:
http://www.google.com/press/zeitgeist/zeitgeist-june.html
http://www.google.com/press/zeitgeist/zeitgeist-jan02.html

Das Sinken des japanischen Anteils stimmt mit unserer Beobachtung überein, dass Japanisch bei den Web-Inhalten inzwischen von Französisch auf Platz vier verdrängt worden ist. Die früher stärkere Stellung des Japanischen hängt offenbar zusammen mit dem Technologievorsprung (Zugang zum Internet, Anzahl der Server usw.), der allmählich schwindet.

Chinesisch nimmt stark zu, wenn auch auf niedrigem Niveau. Ausgehend vom hohen Anteil chinesischsprachiger Menschen an der Weltbevölkerung, ist ein weiterer deutlicher Anstieg zu erwarten. Das aber ist auch abhängig von der künftigen politischen und wirtschaftlichen Entwicklung in China.

Das künftige Potential hängt insgesamt nicht nur von den Sprachanteilen in der Weltbevölkerung ab. Insbesondere englische, daneben vor allem deutsche, französische und spanische Inhalte werden auch von Menschen anderer Muttersprache genutzt. Die Gewichtung dieser Verkehrssprachen scheint im Internet nicht unbedingt gleich mit ihrer allgemeinen Verbreitung als Zweitsprache zu sein. Die erstaunlich starke Stellung des Deutschen dürfte auch zusammenhängen mit der Bildung und der wirtschaftlichen Position (und der daraus resultierenden stärkeren Nutzung des Internets) derer, die Deutsch als Fremdsprache sprechen.

Zur Zukunft der "kleinen" Sprachen im Internet lässt sich keine Prognose machen, dafür sind die zum Vergleich herangezogenen älteren Statistiken zu ungenau. Der hohe Gesamtanteil "sonstiger" Sprachen, die einzeln einen Anteil von weniger als 0,1% erreichen, lässt aber auf eine, zumindest für den regionalen Bereich, große sprachliche Vielfalt schließen. (Immerhin existieren 71900 friesische Seiten und ca. 30000 Seiten auf Latein **.)

Die Entwicklung scheint dahin zu gehen: Großräumige Bedeutung haben im Internet vor allem die Sprachen Englisch, Deutsch, Französisch, Japanisch, Spanisch und Chinesisch. Daneben wird eine große Zahl spezieller Angebote in einer großen Zahl von Sprachen existieren. Das befürchtete Aussterben mancher "kleiner" Sprachen wird das Internet wohl weder beschleunigen noch aufhalten. (Siehe hierzu auch: http://www.rosettaproject.org:8080/live)

Schluss: Usability oder Brauchbarkeit

"Die Bedeutung der unterschiedlichen Sprache kann niemals überbetont werden. Im großen und ganzen sprechen nur 15 Prozent der europäischen Bevölkerung Englisch als Muttersprache - und nur 28 Prozent sprechen überhaupt Englisch."

Mit diesen Zahlen mahnt die Vermarktungsagentur global-reach die anglophonen Anbieter, soviele Seiten, wie das Budget nur zulässt, zumindest in die Sprachen Japanisch, Deutsch und Französisch zu übersetzen. (http://www.global-reach.biz/d/ed/art/rep-eur4.html)

72 Prozent der europäischen Bevölkerung versteht kein Englisch. Und nach einer Untersuchung von argonauts.net versteht ein Großteil der deutschsprachigen Nutzer nicht einmal die auf deutschen Seiten weit verbreiteten englischsprachigen Bestandteile der Menüführung (wie "Home" statt "Startseite", "Support" statt "Hilfe" oder "Sitemap" statt "Inhalt".) Und selbst wenn sie diese Begriffe verstehen, fühlen sich die Nutzer nicht davon angesprochen - auf die Frage, wie die erste Seite eines Internetangebotes bezeichnet werden sollte, antworteten 50% mit "Startseite" und nur 17% mit "Home". (http://www.argonauts.net/eco_public_ergebnisse_index.cfm)

Erfolgreiche Anbieter von Internet-Inhalten haben sich darauf eingestellt. Die amerikanische Suchmaschine Google bietet ihre Dienste in 82 Sprachen an. Die deutschsprachige Seite überzeugt teilweise mit gekonnten übersetzungen ("Auf gut Glück!" statt "I'm feeling lucky!" für das Anklicken der ersten Fundstelle.) Sie bietet zuweilen klareres Deutsch (und ist auch im deutschen Sprachraum erfolgreicher) als die deutsche Konkurrenz.

Die Botschaft an die Webmaster, an diejenigen, die Internet-Inhalte erstellen und anbieten, ist eindeutig: Benutzen Sie die Sprache Ihres Zielpublikums wo immer möglich! Gestalten Sie international orientierte Auftritte mehrsprachig! Sie erreichen Nutzer, mit denen Sie vermutlich nicht gerechnet haben. (So schätzt Global-Reach, dass 750.000 US-Amerikaner vorzugsweise deutschsprachige Seiten nutzen, http://global-reach.biz/globstats/refs.php3#overlap.)

"Usability" oder "Brauchbarkeit" von Internet-Angeboten ist ein von "Usability-Guru" Jakob Nielsen geprägter Begriff. Gemeint ist, dass die Zweckmäßigkeit einer Seite ihre Gestaltung zu bestimmen hat. In diesem Zusammenhang kann man Details untersuchen, etwa wie das menschliche Auge über den Bildschirm wandert. Ein wesentliches Kriterium für Brauchbarkeit ist jedoch die Sprache einer Seite.

"Millionen von Dollar werden in eine Fläche investiert, die nicht mal einen Quadratmeter groß ist", schreibt Nielsen. Damit sind manche Internetseiten die "kostbarste Immobilie der Welt". (Jakob Nielsen und Marie Tahir: »Homepage Usability. 50 enttarnte Webseiten«, zitiert nach http://www.stern.de/computer-netze/readme/pflichtlektuere/artikel/?id=254163&page=0) An den wenigen hundert Dollar, die erforderlich sind für vernünftige sprachliche Gestaltung und für übersetzung einer Seite wird dennoch oft gespart.

In den Anfängen des Internets gab es den Glauben (die Hoffnung, die Befürchtung), das Internet werde zum einsprachigen Global Village. Die heutige Realität des Internets sieht anders aus: Globalität bedeutet Mehrsprachigkeit. Dank der gewaltigen Zunahme des Angebots haben die Nutzer immer häufiger die Möglichkeit, Inhalte in der eigenen oder der bevorzugten Sprache zu finden. Und sie machen davon offensichtlich regen Gebrauch.

________
** Bei der Zählung lateinischer Seiten ergab sich eine hohe Fehlerquote aufgrund derer das Ergebnis mit Kontrollabfragen korrigiert werden musste.

The Chart on English

Autor: 2002
www.netz-tipp.de/sprachen.html

Partner: Autoren, Lesungen, Kinderbücher
© 2000

Startseite