aboutsummaryrefslogtreecommitdiff
path: root/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
diff options
context:
space:
mode:
authorAdrian Kummerlaender2018-09-24 10:01:42 +0200
committerAdrian Kummerlaender2018-09-24 10:01:42 +0200
commit7d937830c21636eddc67bd2b2479cb7a436a7657 (patch)
tree01b4f414950444d4d16c913f6428bd2e079147a5 /articles/2013-10-06_notizen_zu_cpp_und_unicode.md
parentfb97def289b1a59531ac12fd4f6131717b4a9499 (diff)
downloadblog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.tar
blog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.tar.gz
blog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.tar.bz2
blog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.tar.lz
blog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.tar.xz
blog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.tar.zst
blog_content-7d937830c21636eddc67bd2b2479cb7a436a7657.zip
Update code.kummerlaender.eu links
Diffstat (limited to 'articles/2013-10-06_notizen_zu_cpp_und_unicode.md')
-rw-r--r--articles/2013-10-06_notizen_zu_cpp_und_unicode.md2
1 files changed, 1 insertions, 1 deletions
diff --git a/articles/2013-10-06_notizen_zu_cpp_und_unicode.md b/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
index 0238df3..ef12969 100644
--- a/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
+++ b/articles/2013-10-06_notizen_zu_cpp_und_unicode.md
@@ -20,7 +20,7 @@ Wir müssen in diesem Fall also auf externe Bibliotheken wie beispielweise [icon
## Ein UTF-8 Codepoint-Iterator in C++
-Um zumindest für rein lesende Zugriffe auf UTF-8 Strings nicht gleich eine Bibliothek wie Boost oder [easl](http://code.google.com/p/easl/) verwenden zu müssen habe ich einen einfachen UTF-8 Codepoint-Iterator anhand der Spezifikation in [RFC3629](http://tools.ietf.org/html/rfc3629) implementiert. Den Quellcode dieser Klasse stelle ich auf [Github](https://github.com/KnairdA/CodepointIterator) oder in [cgit](http://code.kummerlaender.eu/CodepointIterator/tree/) als Open Source unter der MIT-Lizenz zur freien Verfügung.
+Um zumindest für rein lesende Zugriffe auf UTF-8 Strings nicht gleich eine Bibliothek wie Boost oder [easl](http://code.google.com/p/easl/) verwenden zu müssen habe ich einen einfachen UTF-8 Codepoint-Iterator anhand der Spezifikation in [RFC3629](http://tools.ietf.org/html/rfc3629) implementiert. Den Quellcode dieser Klasse stelle ich auf [Github](https://github.com/KnairdA/CodepointIterator) oder in [Gitea](http://code.kummerlaender.eu/adrian/CodepointIterator/) als Open Source unter der MIT-Lizenz zur freien Verfügung.
UTF-8 enkodiert die aktuell maximal 21 Bit eines Unicode Code-Points in bis zu vier Code-Units mit einer Länge von je einem Byte. Die verbleibenden
maximal 11 Bit werden dazu verwendet, Anfangs- und Fortsetzungs-Bytes eines Code-Points zu kennzeichnen und schon in der ersten Code-Unit zu definieren, in wie vielen Code-Units das aktuelle Symbol enkodiert ist.