Comments on: assert “а” == “a” # lol http://sametmax.com/assert-%d0%b0-a-lol/ Du code, du cul Sat, 07 Nov 2015 11:08:18 +0000 hourly 1 http://wordpress.org/?v=4.1 By: jedema http://sametmax.com/assert-%d0%b0-a-lol/#comment-50464 Thu, 12 Jun 2014 11:41:37 +0000 http://sametmax.com/?p=10433#comment-50464 Génial,

Je vais avoir un humour que mes collègues vont apprécier !

C’est mon premier message alors je tenais à vous remercier. Votre site est génial et étant adepte de Django je l’apprécie encore plus.

]]>
By: Yamakaky http://sametmax.com/assert-%d0%b0-a-lol/#comment-49272 Wed, 11 Jun 2014 13:09:50 +0000 http://sametmax.com/?p=10433#comment-49272 C’est démoniaque…

]]>
By: Sam http://sametmax.com/assert-%d0%b0-a-lol/#comment-48449 Tue, 10 Jun 2014 17:44:40 +0000 http://sametmax.com/?p=10433#comment-48449 C’est déjà le cas. Ca marche pour les caractères composés (et https://pypi.python.org/pypi/Unidecode s’en sert), mais pour des caractères qui sont entiers et juste différents, comme notre a, ça n’aide pas. Tu peux pas dire qu’un b ou un d sont des o avec une barre en haut ou en bas, car cela dépend de la fonte.

]]>
By: PocketTiger http://sametmax.com/assert-%d0%b0-a-lol/#comment-48387 Tue, 10 Jun 2014 16:21:45 +0000 http://sametmax.com/?p=10433#comment-48387 @Kikoololmdr
imagine deux caractères qui sont représentés avec le même glyphe dans une font et avec deux glyphes différentes dans une autre font.

Tu me fais du mal, tu le sais ça… ='( Mais je comprend mieux le souci maintenant.

Ce qu’il faudrait c’est inventer un langage objet de la font. Ou chaque caractère serait une instance de la classe Char.

Dans cette classe tu à un attribut principal servant à définir l’instance, ce serait une lettre ou un caractère simple du langage, sans accent ni propriété particulière.
Ensuite tu aurais des propriétés secondaires. Comme secable, case, accent, cedilla, etc.
Du coup on pourrait comparer un “a” et un “À” de façon stricte, ou souple. Genre “a” == “À” ou “a” === “À”. Et on pourrait savoir tout de suite si un caractère à des propriétés cachées en appelant une méthode du genre “a”. is_secable?. Ça serait beau…

Enfin je pense qu’il doit y avoir une couille dans mon raisonnement, parce que ça m’a l’air un peu trop simple.

]]>
By: Sam http://sametmax.com/assert-%d0%b0-a-lol/#comment-48122 Tue, 10 Jun 2014 13:04:47 +0000 http://sametmax.com/?p=10433#comment-48122 Pour le moment, aucune font ne couvre tout unicode de toute manière.

Quand aux NDD, pour les caractères chinois ou jap, ça a du sens. C’est aussi idiot de demander à 1.5 milliard de personne d’utiliser nos caractères inconpréhensibles pour eux que si on devait tous taper les URLS uniquement en chinois.

]]>
By: Baronsed http://sametmax.com/assert-%d0%b0-a-lol/#comment-48091 Tue, 10 Jun 2014 12:32:02 +0000 http://sametmax.com/?p=10433#comment-48091 Est-ce qu’il n’existerait pas une super-fonte qui serait faite spécialement pour faire la différence entre les caractères qui se ressemblent ?

Par ailleurs, qu’est-ce que vous pensez de la décision d’accepter unicode pour les NDD (moi je crois que c’est une énorme connerie) ?

]]>
By: kontre http://sametmax.com/assert-%d0%b0-a-lol/#comment-47363 Mon, 09 Jun 2014 18:56:07 +0000 http://sametmax.com/?p=10433#comment-47363 En fait, il y a toute une gamme d’identifiants qui sont classés comme nombres, donc bien sûr 0123456789 font partie. Ils sont traités différemment des autres pour les identifiants (on ne peut pas commencer un identifiant par un nombre). De même certains sont qualifiés comme opérateurs, on ne peut pas les utiliser dans un identifiant, comme le signe divisé (le tiret avec un point au dessus et au dessous).

]]>
By: Kikoololmdr http://sametmax.com/assert-%d0%b0-a-lol/#comment-47255 Mon, 09 Jun 2014 17:14:47 +0000 http://sametmax.com/?p=10433#comment-47255 @pockettiger
Je ne vois pas pourquoi tu parles de différents encodages. Il n’en est pas question ici. Il n’y a qu’un seul encodage : utf-8.
Il y a plusieurs caractères qui ont la même gueule mais pas le même sens. Et tu ne vas quand même pas mélanger des choses qui sont sémantiquement différentes.
En plus, ici, c’est un cas “simple”. Mais imagine deux caractères qui sont représentés avec le même glyphe dans une font et avec deux glyphes différentes dans une autre font. T’auras l’air malin si tu donnes tout le temps le même code unicode à ces deux caractères (et dans les maisons d’éditions, on rigole pas avec ce genre de chose).
Et mettre des limites pour dire que tel ou tel caractères sont identique et doivent avoir le même code, c’est très difficile. Par exemple, vendredi, il y a un stagiaire dans ma boite qui s’est amusé à remplacer les apostrophes et guillemets française par les anglaises sur un gros volume de données. Comme ça, pouf, parce que pour lui, c’est identique, ça a la même tronche sur son éditeur de code. Et ça a râlé très fort (la question du pourquoi un stagiaire bosse sur ce genre de chose est un autre débat, et je n’étais pas d’accord pour ça).

Si en python, on craint ce genre de truc, on encode son fichier source en ascii/latin-1 (qui ne comprend pas les caractères cyrillique par exemple). Et il t’enverra chier si tu mets n’importe quoi dedans.

]]>
By: Sam http://sametmax.com/assert-%d0%b0-a-lol/#comment-46933 Mon, 09 Jun 2014 14:21:05 +0000 http://sametmax.com/?p=10433#comment-46933 Ouai, wordpress ne gère pas l’unicode correctement. Quelle surprise !

Mais oui, on ne peut pas faire pileofpoo = 1. J’ai aussi essayé :D

]]>
By: Goldy http://sametmax.com/assert-%d0%b0-a-lol/#comment-46782 Mon, 09 Jun 2014 12:23:34 +0000 http://sametmax.com/?p=10433#comment-46782 Tiens, on dirait que les emoji font planter les commentaires :/

Désolé

]]>