Discussion:
Nicht druckbares Zeichen U+00A0 grafisch hervorheben: Editor fuer Windows?
(zu alt für eine Antwort)
Andreas Borutta
2011-05-15 11:06:50 UTC
Permalink
Moin.

Bisher verwende ich Ultraedit (Windows) als Texteditor.

Nun möchte ich Code editieren in welchem das Unicodezeichen U+00A0
(geschütztes Leerzeichen) vorkommt. (Die genauen Gründe tun hier
nichts zur Sache.)

Das Zeichen wird nicht grafisch gekennzeichnet. Somit kann es nicht
von einem normalen Leerzeichen unterschieden werden.

Loading Image...

Frage:
Könnt ihr mir einen Editor für Windows außer Emacs (die Einarbeitung
ist mir zu aufwändig, ich bitte dafür um Verständnis) empfehlen, der
das U+00A0 mit einer Hintergrundfarbe hervorhebt?

Wichtig ist dabei auch:
Es soll festgelegt werden können, welche nichtdruckbaren Zeichen
angezeigt werden sollen.
Typischerweise will ich Zeilenschaltungen, normale Leerzeichen und
Tabs nicht sehen.

Gut wäre es, wenn sämtliche nichtdruckbaren Zeichen mit derselben
Hintergrundfarbe gekennzeichnet werden.
Wie im Screenshot zu sehen ist, ist eine Kennzeichnung allein durch
die Schriftfarbe unzureichend.
Die jeweiligen Symbole, die der Editor zur Kennzeichnung der nicht
druckbaren Zeichen einsetzt (grau), sind kaum von den entsprechenden
Zeichen (schwarz) unterscheidbar.
Verwechselung wäre vorprogrammiert.

Danke für Euren Rat.

Andreas

P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
--
http://borumat.de
http://fahrradzukunft.de
Reiner Steib
2011-05-15 12:40:29 UTC
Permalink
Post by Andreas Borutta
Könnt ihr mir einen Editor für Windows außer Emacs
Selbst schuld. Wer nicht will ...

,----[ M-x describe-face RET nobreak-space RET ]
| Face: nobreak-space (sample) (customize this face)
| Documentation: Face for displaying nobreak space.
| Defined in `faces.el'.
`----
Post by Andreas Borutta
(die Einarbeitung ist mir zu aufwändig, ich bitte dafür um
Verständnis) empfehlen, der das U+00A0 mit einer Hintergrundfarbe
hervorhebt?
Viele Grüße
Reiner
--
,,,
(o o)
---ooO-(_)-Ooo--- | PGP key available | http://rsteib.home.pages.de/
Heino Tiedemann
2011-05-15 19:10:40 UTC
Permalink
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
Ich bin mir echt nicht sicher, ob das Unicode Sonderzeichen damit
klappt, einer Du kannst es mal Versuchen:

Notepad++

Für Installations-Skeptiker gibts auch eine Portable Version.

http://portableapps.com/apps/development/notepadpp_portable


Heino
Andreas Borutta
2011-05-15 19:39:52 UTC
Permalink
Post by Heino Tiedemann
Ich bin mir echt nicht sicher, ob das Unicode Sonderzeichen damit
Notepad++
Für Installations-Skeptiker gibts auch eine Portable Version.
http://portableapps.com/apps/development/notepadpp_portable
Notepad++ kennzeichnet das U+00A0 nicht:

Loading Image...

"View > Show Symbol > Show all Charakters"

Andreas
--
http://borumat.de
http://fahrradzukunft.de
Heino Tiedemann
2011-05-15 20:34:08 UTC
Permalink
Post by Andreas Borutta
Post by Heino Tiedemann
Ich bin mir echt nicht sicher, ob das Unicode Sonderzeichen damit
Notepad++
Für Installations-Skeptiker gibts auch eine Portable Version.
http://portableapps.com/apps/development/notepadpp_portable
http://borumat.de/+screenshots/hc-2011.05.15-21_39_21.png
"View > Show Symbol > Show all Charakters"
Okay, dann scheidet vermutlich Scite auch aus - der benutzt die
gleiche Engine wie Notepad++

Schade.


Heino


PS.:

Falls Du es doch verscuehn willst:

http://www.scintilla.org/SciTEDownload.html
Stefan Reuther
2011-05-16 06:08:06 UTC
Permalink
Post by Andreas Borutta
Bisher verwende ich Ultraedit (Windows) als Texteditor.
Nun möchte ich Code editieren in welchem das Unicodezeichen U+00A0
(geschütztes Leerzeichen) vorkommt. (Die genauen Gründe tun hier
nichts zur Sache.)
Das Zeichen wird nicht grafisch gekennzeichnet. Somit kann es nicht
von einem normalen Leerzeichen unterschieden werden.
Extras > Optionen > Anzeige > Syntaxhervorhebung, Wortlistendatei
oeffnen, das geschuetzte Leerzeichen zu den passenden /Delimiters
hinzufuegen, sowie einen Abschnitt
/C5"Nonbreaking space"
<hier U+00A0>
(statt /C5 einen freien Code waehlen). Datei speichern und in o.a.
Dialog dem Nonbreaking space eine Farbe zuweisen.
Post by Andreas Borutta
http://borumat.de/+screenshots/hc-2011.05.15-12_44_53.png
Könnt ihr mir einen Editor für Windows außer Emacs (die Einarbeitung
ist mir zu aufwändig, ich bitte dafür um Verständnis) empfehlen, der
das U+00A0 mit einer Hintergrundfarbe hervorhebt?
Obiges habe ich mithilfe der UltraEdit-Hilfe rausgefunden, waehrend
der Emacs gebootet hat :->

Davon abgesehen ist die aufwaendige Einarbeitung beim Emacs ein
Geruecht. Ein frischer Emacs bedient sich genauso wie Notepad,
zumindest bei den Funktionen die beide gemeinsam haben. Alles, was
darueber hinaus geht, muss gelernt werden. Das ist aber bei jedem
anderen Windows-Editor genauso.
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
Im Normalfall Fixedsys. Fuer Unicode also Fixedsys Excelsior.


Stefan
Andreas Borutta
2011-05-16 07:06:05 UTC
Permalink
Post by Stefan Reuther
Post by Andreas Borutta
Bisher verwende ich Ultraedit (Windows) als Texteditor.
Nun möchte ich Code editieren in welchem das Unicodezeichen U+00A0
(geschütztes Leerzeichen) vorkommt. (Die genauen Gründe tun hier
nichts zur Sache.)
Das Zeichen wird nicht grafisch gekennzeichnet. Somit kann es nicht
von einem normalen Leerzeichen unterschieden werden.
Extras > Optionen > Anzeige > Syntaxhervorhebung, Wortlistendatei
oeffnen, das geschuetzte Leerzeichen zu den passenden /Delimiters
hinzufuegen, sowie einen Abschnitt
/C5"Nonbreaking space"
<hier U+00A0>
(statt /C5 einen freien Code waehlen). Datei speichern und in o.a.
Dialog dem Nonbreaking space eine Farbe zuweisen.
Herzlichen Dank. :)
Hat auf Anhieb - zum Ausprobieren habe ich das Syntaxfile für PHP
ergänzt - geklappt.

Da ich nicht genau wußte, was Du mit "passenden" meintest, habe ich
das U+00A0 in der Zeile

| /Delimiters =

hinzugefügt.

Wie geht man bitte vor, wenn das U+00A0 nicht nur in spezifischen
Dateien hervorgehoben werden soll, sondern in allen?
Post by Stefan Reuther
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
Im Normalfall Fixedsys. Fuer Unicode also Fixedsys Excelsior.
Interessant. Auch für diesen Hinweis vielen Dank.

http://www.fixedsysexcelsior.com/
Habe ich ausprobiert.
Loading Image...

Etwas gewöhnungsbedürftig ist die typische Liniendicke von 2px und die
sehr stark gefüllten Nullen.

Andreas
--
http://borumat.de
http://fahrradzukunft.de
Andreas Borutta
2011-05-16 11:10:43 UTC
Permalink
Post by Andreas Borutta
Post by Stefan Reuther
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
Im Normalfall Fixedsys. Fuer Unicode also Fixedsys Excelsior.
Interessant. Auch für diesen Hinweis vielen Dank.
http://www.fixedsysexcelsior.com/
Habe ich ausprobiert.
http://borumat.de/+screenshots/hc-2011.05.16-09_04_00.png
Etwas gewöhnungsbedürftig ist die typische Liniendicke von 2px und die
sehr stark gefüllten Nullen.
Negativ fällt mir auf:
Der Halbgeviertstrich wird schmaler dargestellt als der
Viertelgeviertstrich.

Loading Image...

Andreas
--
http://borumat.de
http://fahrradzukunft.de
Stefan Reuther
2011-05-16 16:00:26 UTC
Permalink
Post by Andreas Borutta
Post by Stefan Reuther
Extras > Optionen > Anzeige > Syntaxhervorhebung, Wortlistendatei
oeffnen, das geschuetzte Leerzeichen zu den passenden /Delimiters
hinzufuegen, sowie einen Abschnitt
/C5"Nonbreaking space"
<hier U+00A0>
(statt /C5 einen freien Code waehlen). Datei speichern und in o.a.
Dialog dem Nonbreaking space eine Farbe zuweisen.
Herzlichen Dank. :)
Hat auf Anhieb - zum Ausprobieren habe ich das Syntaxfile für PHP
ergänzt - geklappt.
Da ich nicht genau wußte, was Du mit "passenden" meintest, habe ich
das U+00A0 in der Zeile
| /Delimiters =
hinzugefügt.
Die Datei ist in Blöcke unterteilt, die mit "/L" getrennt werden, pro
unterstützter Sprache einer. Dort muss das Zeichen in die passenden
/Delimiters. Wenn man das nicht macht, wird es in einem Kontext wie
foo\u00A0bar
nicht hervorgehoben, weil es ja zu einem Wort gehört, folglich nicht als
einzelnes Syntaxelement gefärbt wird.
Post by Andreas Borutta
Wie geht man bitte vor, wenn das U+00A0 nicht nur in spezifischen
Dateien hervorgehoben werden soll, sondern in allen?
Ich bin kein UltraEdit-Profi, glaube aber, das so verstanden zu haben,
dass buntmachen um UE nur sprachspezifisch geht. Sonst lies halt mal die
Hilfeseite durch, die bei der Wortlistendatei verlinkt ist.
Post by Andreas Borutta
Post by Stefan Reuther
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
Im Normalfall Fixedsys. Fuer Unicode also Fixedsys Excelsior.
Interessant. Auch für diesen Hinweis vielen Dank.
http://www.fixedsysexcelsior.com/
Habe ich ausprobiert.
http://borumat.de/+screenshots/hc-2011.05.16-09_04_00.png
Etwas gewöhnungsbedürftig ist die typische Liniendicke von 2px und die
sehr stark gefüllten Nullen.
Ich finde die Fixedsys vor allem auf handelsüblichen 17"/19" 1280x1024
sehr gut lesbar, weil es eben eine Pixelschrift mit einer mir angenehmen
Liniendicke ist. Die Fixedsys Excelsior ist dann eine Truetype-Schrift,
die so gebaut ist, dass sie bei entsprechender Skalierung identisch
gerendert wird. Ach ja, ich arbeite mit schwarzem Bildhintergrund, das
halte ich (vor allem im Vollbildmodus) für weniger belastend als weißen
Hintergrund.

Auf typografische Feinheiten lege ich beim Coden dann nicht so viel
Wert. Eine unterschiedliche Länge bei Halbgeviert- und Viergelgeviert-
strich ist ja auch irgendwie ein Widerspruch zu "alle Zeichen gleich breit".


Stefan
Andreas Borutta
2011-05-16 18:08:57 UTC
Permalink
Post by Stefan Reuther
Post by Andreas Borutta
Post by Stefan Reuther
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
Im Normalfall Fixedsys. Fuer Unicode also Fixedsys Excelsior.
Interessant. Auch für diesen Hinweis vielen Dank.
http://www.fixedsysexcelsior.com/
Habe ich ausprobiert.
http://borumat.de/+screenshots/hc-2011.05.16-09_04_00.png
Etwas gewöhnungsbedürftig ist die typische Liniendicke von 2px und die
sehr stark gefüllten Nullen.
[...]
Auf typografische Feinheiten lege ich beim Coden dann nicht so viel
Wert. Eine unterschiedliche Länge bei Halbgeviert- und Viergelgeviert-
strich ist ja auch irgendwie ein Widerspruch zu "alle Zeichen gleich breit".
Die meisten Glyphen von Festbreitenschriften reichen ja nicht über die
gesamte Dickte. Ein "i" steht eben in der Mitte der Dickte (sagt man
das so?).

Auf jeden Fall ist es unsinnig den Halbgeviertstrich schmaler als den
Viertelgeviertstrich zu formen.

Aber Fixedsys ist auf jeden Fall ein Ausprobieren wert. Ich habe noch
nie mit einem Font mit so dicker Strichstärke gearbeitet.

Andreas
--
http://borumat.de
http://fahrradzukunft.de
Stefan Reuther
2011-05-17 16:38:43 UTC
Permalink
Post by Andreas Borutta
Post by Stefan Reuther
[...]
Auf typografische Feinheiten lege ich beim Coden dann nicht so viel
Wert. Eine unterschiedliche Länge bei Halbgeviert- und Viergelgeviert-
strich ist ja auch irgendwie ein Widerspruch zu "alle Zeichen gleich breit".
Die meisten Glyphen von Festbreitenschriften reichen ja nicht über die
gesamte Dickte. Ein "i" steht eben in der Mitte der Dickte (sagt man
das so?).
Auf jeden Fall ist es unsinnig den Halbgeviertstrich schmaler als den
Viertelgeviertstrich zu formen.
Wobei ich da jetzt mal nachhaken muss: welcher ist bei dir der Halb- und
der Viertelgeviertstrich? HYPHEN-MINUS?

Zeichen Unicode Windows-Name Unicode-Name
- 002D Bindestrich-Minus HYPHEN-MINUS
‐ 2010 Bindestrich HYPHEN
‑ 2011 Bindestrich (kein Zeilenumbruch) NON-BREAKING HYPHEN
‒ 2012 Gedankenstrich FIGURE DASH
– 2013 Bindestrich EN DASH
— 2014 Gedankenstrich EM DASH
― 2015 Horizontale Linie HORIZONTAL BAR

Mit FixedSys Excelsior sehe ich für die ersten vier einen gleich brei-
ten, mittellangen Strich. Der EN DASH ist kürzer, der EM DASH länger.
HYPHEN müsste nun eigentlich kürzer sein, wurde aber eben hier dem
HYPHEN-MINUS gleichgesetzt, und das letzterer länger ist, ist für eine
Bildschirmschriftart, die zum Programmieren eingesetzt wird, eigentlich
vorteilhaft.

In DejaVu Sans Mono sind dafür EN und EM DASH gleich lang. Und Lucida
Console, Bitstream Vera Sans Mono, Courier New haben die HYPHEN-
Variationen gar nicht erst. Also jammern wir hier auf hohem Niveau :-)


Stefan
Andreas Borutta
2011-05-17 20:34:27 UTC
Permalink
Post by Stefan Reuther
Post by Andreas Borutta
Post by Stefan Reuther
Auf typografische Feinheiten lege ich beim Coden dann nicht so viel
Wert. Eine unterschiedliche Länge bei Halbgeviert- und Viergelgeviert-
strich ist ja auch irgendwie ein Widerspruch zu "alle Zeichen gleich breit".
Die meisten Glyphen von Festbreitenschriften reichen ja nicht über die
gesamte Dickte. Ein "i" steht eben in der Mitte der Dickte (sagt man
das so?).
Auf jeden Fall ist es unsinnig den Halbgeviertstrich schmaler als den
Viertelgeviertstrich zu formen.
Wobei ich da jetzt mal nachhaken muss: welcher ist bei dir der Halb- und
der Viertelgeviertstrich? HYPHEN-MINUS?
http://de.wikipedia.org/wiki/Viertelgeviertstrich
In der deutschen Sprache spielen also die ersten drei von Dir
genannten eine Rolle.
Post by Stefan Reuther
Zeichen Unicode Windows-Name Unicode-Name
- 002D Bindestrich-Minus HYPHEN-MINUS
‐ 2010 Bindestrich HYPHEN
‑ 2011 Bindestrich (kein Zeilenumbruch) NON-BREAKING HYPHEN
‒ 2012 Gedankenstrich FIGURE DASH
– 2013 Bindestrich EN DASH
— 2014 Gedankenstrich EM DASH
― 2015 Horizontale Linie HORIZONTAL BAR
Mit FixedSys Excelsior sehe ich für die ersten vier einen gleich brei-
ten, mittellangen Strich.
Gegen gleiche Länge dieser vier ist ja auch nix zu sagen.
Post by Stefan Reuther
Der EN DASH ist kürzer,
Dagegen schon.

In anderen mir bisher bekannten Proportional-Fonts (mit
Festbreitenfonts habe ich kaum Erfahrung, daher hier auch meine Bitte
um Rat) ist der EN DASH länger als
002D
2010
2011
Post by Stefan Reuther
der EM DASH länger.
HYPHEN müsste nun eigentlich kürzer sein, wurde aber eben hier dem
HYPHEN-MINUS gleichgesetzt, und das letzterer länger ist, ist für eine
Bildschirmschriftart, die zum Programmieren eingesetzt wird, eigentlich
vorteilhaft.
In DejaVu Sans Mono sind dafür EN und EM DASH gleich lang.
Nicht gut.
Post by Stefan Reuther
Und Lucida
Console, Bitstream Vera Sans Mono, Courier New haben die HYPHEN-
Variationen gar nicht erst. Also jammern wir hier auf hohem Niveau :-)
:)

Andreas
--
http://borumat.de
http://fahrradzukunft.de
David Kastrup
2011-05-16 08:22:12 UTC
Permalink
Post by Stefan Reuther
Obiges habe ich mithilfe der UltraEdit-Hilfe rausgefunden, waehrend
der Emacs gebootet hat :->
Mein Emacs ist schneller oben inkl. Laden des letztgespeicherten
Desktops mit einer zweistelligen Zahl an Dateien als ein Firefox ohne
Session. Oder auch ein XEmacs ohne Session. Oder auch ein OpenOffice.

Und wenn das nicht reicht, gibt es emacsclient.

Die Witzeleien über den Resourcenverbrauch von Emacs sind heutzutage
absurd, waren vor 10 Jahren fragwürdig, und vor 20 Jahren durchaus nicht
unzutreffend.
--
David Kastrup
Stefan Reuther
2011-05-16 15:52:45 UTC
Permalink
Post by David Kastrup
Post by Stefan Reuther
Obiges habe ich mithilfe der UltraEdit-Hilfe rausgefunden, waehrend
der Emacs gebootet hat :->
Mein Emacs ist schneller oben inkl. Laden des letztgespeicherten
Desktops mit einer zweistelligen Zahl an Dateien als ein Firefox ohne
Session. Oder auch ein XEmacs ohne Session. Oder auch ein OpenOffice.
Meiner bootet tatsächlich fünf Minuten, lädt dann aber eben auch die
Dateien inkl. Undo-Informationen und Histories der letzten Jahre. Die
meiste Zeit braucht das font-lock für 1000 Buffer. Quartalsweise wird
mal ausgemistet. Das ist ein sichere-und-restauriere-den-Zustand-Modul,
was ich zusammengebraten hab, bevor es in den Standard-Emacsen verfügbar
war. Da hänge ich doch schon ein bisschen dran :-)


Stefan
Heino Tiedemann
2011-05-17 16:58:01 UTC
Permalink
Post by Stefan Reuther
Obiges habe ich mithilfe der UltraEdit-Hilfe rausgefunden, waehrend
der Emacs gebootet hat :->
Das glaube ich nicht!

Diese angeblich lange Emacs Boot-Time ist doch mittlerweile nur noch
eine legende für Lagerfeuerromantik :)

Mein Büro PC ist nun echt lahm, aber der Emacs ist mit das schnellste
was gestartet wird. Fast so schnell wie Scite, aber wesentlich
schneller als Notepad++ oder Ultra Edit.


Heino
frank paulsen
2011-05-16 08:55:45 UTC
Permalink
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
DejaVu Mono

http://dejavu-fonts.org/wiki/Main_Page
--
frobnicate foo
Florian Rehnisch
2011-05-17 02:20:38 UTC
Permalink
Post by Andreas Borutta
Könnt ihr mir einen Editor für Windows außer Emacs (die Einarbeitung
ist mir zu aufwändig, ich bitte dafür um Verständnis) empfehlen, der
das U+00A0 mit einer Hintergrundfarbe hervorhebt?
vim73 - highlighting - conceal

JFT
Post by Andreas Borutta
P.S.: Was ist Euer liebster Festbreitenfonts für Code, der Glyphen für
viele Unicodezeichen enthält?
X11: terminus

flori
Christian Brabandt
2011-05-17 18:54:22 UTC
Permalink
Post by Florian Rehnisch
Post by Andreas Borutta
Könnt ihr mir einen Editor für Windows außer Emacs (die Einarbeitung
ist mir zu aufwändig, ich bitte dafür um Verständnis) empfehlen, der
das U+00A0 mit einer Hintergrundfarbe hervorhebt?
vim73 - highlighting - conceal
Concealing eigentlich nicht. Aber ein

hi def link WhiteSpaceError Error
match WhiteSpaceError /[\x0b\x0c\u00a0\u1680\u180e\u2000-\u200a\u2028\u202f\u205f\u3000]/

sollte es eigentlich tun (das matcht offensichtlich noch ein paar andere
absonderliche Whitespaces, aber das ist in diesem Fall irrelevant).

Oder man konfiguriert sich 'listchars' entsprechend und setzt hinterher
die 'list' Option.

regards,
Christian
Loading...