Publicado hace 17 años por SPukEYe74H a apipes.blogspot.com

Increíble fallo de Notepad

apipes.blogspot.com

Escribe "this app can break" en un bloc de notas y guardalo con cualquier nombre y cualquier extensión. Ahora prueba a abrirlo. Vivir para ver (en Windows 2000/XP).

Comentarios

Ordenados

Liamngls

hace 17 años

editado

¿Cualquier nombre y cualquier extensión o solo cualquier nombre y como txt?

V 0

K 18

Desactivado

hace 17 años

editado

Curioso..

V 0

K 7

Desactivado

hace 17 años

editado

juas , pos vaya...
#1 escribe eeso y guardalo como archivo de texto y vuelve a abrirlo

V 0

K 6

Baloo

hace 17 años

editado

¿Un huevo de pascua o un grito desesperado de advertencia de un programador de microsoft?

V 0

K 13

Liamngls

hace 17 años

editado

Lo guardo como texto, lo abro y veo lo mismo que cuando lo había escrito antes de guardarlo, no sucede nada extraño

V 0

K 18

Desactivado

hace 17 años

editado

#5 sin las comillas, a ver si es por esos. Salen cosas raras

V 0

K 19

Baloo

hace 17 años

editado

A mi si me funciona, abro notepad, copiopego salvo como "loquesea.txt" y al abrir salen caracteres extraños (cajas a falta de caracteres chinos instalados).

Por lo visto es un error de la api a la hora de detectar la encodificacion de tipo UTF-16 (pedancia +5).

V 0

K 13

Liamngls

hace 17 años

editado

He probado de las dos formas.

¿No será algo exclusivo de Windows XP? Lo digo porque yo tengo Windows 98, entonces la noticia es errónea, debería especificar para que sistema operativo (concreto) es ¿no?

V 0

K 18

Agar

hace 17 años

editado

Curioso (tengo Windows XP)

V 0

K 19

#10

raxor

hace 17 años

editado

桴獩愠灰挠湡戠敲歡, veo caracteres chinos, curioso.

V 0

K 6

#11

Baloo

hace 17 años

editado

Va a ser... WindowsXP Only! ;-P

V 0

K 13

#12

Desactivado

hace 17 años

editado

#8 En Windows 2000 SP4... Liam, será cosa de los Win NT y con 98 no funciona. Ni idea

V 0

K 7

#13

antuan

hace 17 años

editado

correcto, con win2k...

V 0

K 7

#14

Liamngls

hace 17 años

editado

Entonces yo pondría otra descripción en el envío, mira que lo he hecho todo ilusionado para nada ... como consuelo me queda poder hacerlo por la mañana, si me acuerdo ...

V 0

K 18

#15

SPukEYe74H

hace 17 años

autor

editado

He cambiado la descripción con lo de XP.

V 0

K 6

#16

Desactivado

hace 17 años

editado

¿Y nadie sabe chino para traducirnos lo que pone? Podría ser interesante.

V 0

K 6

#17

Desactivado

hace 17 años

editado

Según pone aquí http://www.wincustomize.com/articles.aspx?SID=1&AID=117870&c=1 son caracteres aleatorios o sin sentido en chino.
Para el que no lo vea: http://i7.photobucket.com/albums/y258/KarnEvil60/Graphic_5_22_20065_04_18PM.jpg

V 0

K 19

#18

Jason_v

hace 17 años

editado

Curioso cuanto menos

V 0

K 19

#19

Desactivado

hace 17 años

editado

Déjenme que pruebe:

sudo apt-get install notepad...
...
E: No se puede encontrar el paquete notepad

Oh, wait...

V 0

K 7

#20

Desactivado

hace 17 años

editado

桴獩愠灰挠湡戠敲歡
No puedo evitar ponerlo, y si escribes
"this cat can split" o
"xxxx xxx xxx xxxxx" o
"abcd efg hij klmno"
te salen cosas raras también

V 0

K 13

#21

jorginius

hace 17 años

editado

"Increible", lo que se dice "increible"... Si guardáis un texto en una codificación y tratáis de interpretarlo con otra es normal que "se vea mal".

En el ejemplo del meneo escribes caracteres de 8 bits y luego los interpretas como de 16. Eso petaría igual en cualquier sitio, no solo en windows. En linux estoy harto de verlo y eso que ahí unicode significa utf-8, que es compatible con ascii.

Lo malo es que el notepad no tiene una opción de cambiar la codificación sobre la marcha. Si te pasa una cosa de estas tienes que abrir otra vez el archivo y elegir ahí la codificación o usar un editor de verdad.

V 0

K 9

#22

lopez

hace 17 años

editado

no se yo si será un error, puede que tenga sentido. Usando el traductor de google http://google.com/translate

桴獩愠灰挠湡戠敲歡
de chino a ingles es
After 獩 indignant grey harassment 湡 personal sounded Fun
que pasandolo a español es
Después de la diversión sonada personal del 湡 gris indignado del hostigamiento del 獩

Despues de dos traducciones mas o menos literales parece que podría tener algun sentido, así que puede que si sea un huvo de pascua y no un error

#20 a mi con el resto de cadenas no me sale nada raro

EDITO: Me acabo de dar cuenta de que al volver a poner la primera cadena, guardarlo como un archivo nuevo y abrirlo, ya sale bien, así que puede que las otras cadenas si funcionen

V 0

K 6

#23

frodho

hace 17 años

editado

Lo he probado y solo funciona si lo copias tal como esta o lo escribes tal como esta, pero si le das enter o retorno de carro o le adicionas un espacio al final de "this app can break "
no funciona el truco

V 0

K 6

#24

jorginius

hace 17 años

editado

#22 A ver, no te comas la cabeza que no hay mensaje oculto.

Notepad, que tiene ANSI como código por defecto, escribe esto en el archivo (en hex)

74 68 69 73 20 61 70 70 20 63 61 6e 20 62 72 65 61 6b

Donde 74 es 't' y etc, etc. Luego, al abrirlo Notepad se hace un pequeño lío (demasiado poco texto y demasiado regular para autodetectar) y lo interpreta como si hubiera texto UTF-16LE, agrupando los bytes asi:

6874 7369 6120 7070 6320 6e61 6220 6572 6b61

Y ya está resuelto el misterio, porque 0x6874 es 桴, 0x7369 獩... Y podéis seguir descifrando (o crear más ejemplos) mirando los códigos aquí:

http://www.isthisthingon.org/unicode/

Para ver la frase original de nuevo en el notepad sólo tienes que marcar en el cuadro de "Abrir..." que lo haga como ansi en vez de unicode.

V 0

K 9

#25

Desactivado

hace 17 años

editado

Me quito el sombrero, #24

V 0

K 7

#26

Desactivado

hace 17 años

editado

#25: Usas Red Hat?

V 0

K 17

#27

emarts

hace 17 años

editado

#26, El sombrero no solo es rojo
http://www.stallman.org/articles/yellow-hat.html

V 0

K 9

#28

jorginius

hace 17 años

editado

#25 naaa, si es una chorrada

En el meneo explican por donde van los tiros pero si alguien quiere leer más, hace tiempo Joel escribió un artículo muy bueno sobre la problemática de las codificaciones:

http://www.joelonsoftware.com/articles/Unicode.html

V 0

K 9

#29

carloslmz

hace 17 años

editado

pues a mi me sale poniendo "linux sucks", muy curioso lo que se puede encontrar de microsoft en contra de el OS del pingüino...

V 0

K 6

#30

punkesito

hace 17 años

editado

ami me sale poniendo "nose con que comer" jkajkajka.

V 0

K 6

#31

pitsar

hace 17 años

editado

para los que se esten matando haciendolo en win 98 o en otro y no le sale, en el articulo muy bien sale en que sistema operativo : "Vivir para ver (en Windows 2000/XP)."

V 0

K 6

#32

janmi

hace 17 años

editado

#24 lo ha dejado bien claro

A mí con W2000PRO me salen cuadraditos, pero al abrirlo con EDIT desde línea de comandos veo el texto correctamente.

V 0

K 6

#33

vicious

hace 17 años

editado

Lo que nos lleva a deducir que el NotePad de Windows, muestra lo que quiere el programador, y no siempre lo que debe mostrar...

Otro ejemplo de código malicioso en aplicaciones de M$... menos mal que hay otros visores de txt y editores que no sean preciosa kakita

V 0

K 7

#34

RamSys

hace 17 años

editado

#7:
(pedantería +5, gramática -5)

sin acritud

V 0

K 7

#35

Desactivado

hace 17 años

editado

A mi esto me pasaba con php. Al escribir en el fichero 2 o 3 veces hola mundo. efectivamente poniendo "hola mundohola mundohola mundo" también pasa. y yo que pensaba que era fallo mio

V 0

K 6

#36

jorginius

hace 17 años

editado

#32 Con edit tienes el problema inverso: un texto de caracteres anchos de 16 bits con o sin BOM te lo va a interpretar como ascii con el código de página que esté usando la consola de Windows porque no entiende otra cosa.

El mismo mensaje guardado como unicode y visto en edit sería dos caracteres raros (el BOM) seguido de: "t h i s a p p c a n b r e a k", donde los espacios extras no son espacios sino el caracter no imprimible 0x00.

En realidad la consola de Windows (y edit en consecuencia) tiene soporte para unicode pero no está activado por defecto por el tema de la compatibilidad. El problema de notepad --que no es una aplicación sino un ejemplo del Visual Studio-- es que por defecto escribe en un formato y por defecto tiende a leer en otro.

V 0

K 9

#37

Chimuelo

hace 17 años

editado

Pues yo no utilizo Notepad y también me sale el mismo error. Así que una de dos, o es un fallo del propio Windows o el otro programa utiliza el mismo método para detectar la codificación.

Por si alguien quiere probarlo, es este: http://www.flos-freeware.ch/notepad2.html

V 0

K 9

#38

kolme

hace 17 años

editado

$ echo this app can break > pr
$ file pr
pr: ASCII text
$ cat pr
this app can break

$ echo 桴獩愠灰挠湡戠敲歡 > pr2
$ file pr2
pr2: UTF-8 Unicode text
$ cat pr2
桴獩愠灰挠湡戠敲歡

Muahaha, chúpate esa, MS!!

V 0

K 7

#39

jorginius

hace 17 años

editado

#37 la función para adivinar la codificación (si no hay BOM ni nada) que usa notepad es la windows que si no es capaz de decidir, opta por devolver la codificación por defecto de windows que es UTF-16LE. Por un lado notepad guarda ascii si no le decimos nada y por otro windows supone que cualquier texto que no sepa que es es unicode.

#38 file hace algo tan tonto como contar el número de caracteres imprimibles según el rango de los juegos de caracteres usuales. Ese archivo pr, si estás usando una consola UTF-8, es en realidad un archivo UTF-8 pero file no ha sido capaz de adivinarlo.

V 0

K 9

Increíble fallo de Notepad

Escribe "this app can break" en un bloc de notas y guardalo con cualquier nombre y cualquier extensión. Ahora prueba a abrirlo. Vivir para ver (en Windows 2000/XP).

Etiquetas

Comentarios