Ursprungsmitteilung
Thema UTF-8 Strings? 
Autor Ivo Blöchliger 
Eingangsdatum 2020-01-26 16:41:38.0 
Mitteilung Gibt es eine Möglichkeit, utf-8-Zeichen in Strings zu verwenden (in erster Linie natürlich Umlaute)?

Das schlägt bei mir fehl, trotz
<code>
# -*- coding: utf-8 -*-
</code>

und

<code>
a = u"für Umlaute!"
</code>

Interessanterweise werden aber mit der Encoding-Zeile Kommentare mit utf-8 Zeichen akzeptiert (immerhin, da stehen meine Umlaute drin).

Das ist sowohl für die Version vom Oktober '19 wie bei der der Version vom Januar '20 der Fall.
Ich arbeite mit Java8 auf Linux (und Windoze im Unterricht).

Herzliche Grüsse und danke für die tolle IDE! 
 
      
Antworten
Thema UTF-8 Strings 
Autor Tobias Kohn 
Eingangsdatum 2020-01-27 09:56:43.0 
Mitteilung Vielen Dank für die Anfrage und Bug-Report. Die Problematik ist uns bekannt, aber leider können wir zur Zeit keine wirklich Lösung anbieten.

Leider bereitet uns Unicode schon seit Jahren immer wieder Mühe. Der Grund dafür ist letztlich, dass Java zwar mit Unicode arbeitet, der Python 2-Standard hingegen ganz auf Ascii ausgerichtet ist (obwohl es auch da einen Unicode-Datentyp gibt). Um möglichst Python 2 konform zu sein prüft Jython Strings "manuell" und wirft Fehler, wenn ein Unicode-Zeichen gefunden wird. Das ging teilweise soweit, dass sich Jython auch nicht mehr starten liess, wenn der Pfad einen Umlaut enthielt.

Von TigerJython her haben wir versucht, diese manuellen Prüfungen so gut als möglich zu umgehen und auszuschalten, damit man in den meisten Fällen ohne weiteres Zutun auch Umlaute verwenden kann. Allerdings konnten wir nicht das gesamte String-Handling so umbauen, wie es wohl nötig wäre und daher gibt es immer wieder Fälle, wo Unicode noch immer Probleme bereitet.

Im Moment arbeiten wir aber daran, TigerJython ganz auf Python 3 umzustellen. Damit löst sich das Problem dann "von selbst", weil Python 3 sowieso Unicode-basiert ist. Unser Ziel ist es, bis im Sommer die neue Version veröffentlichen zu können. Dafür legen wir aber eben unseren gesamten Fokus zur Zeit auf diese Neuentwicklung und sehen davon ab, am bestehenden System weiter zu "basteln".

Mit herzlichen Grüssen
Tobias Kohn