Preguntas con la etiqueta [unicode]

Lista unicode preguntas

Necesito reemplazar todos los caracteres que no sean ASCII (\x00-\x7F) con un espacio. Me sorprende que esto no sea tan fácil en Python, a menos que me esté perdiendo algo.

u'\ufeff' en una cadena de Python

7
respuestas
333
votos
381.2k
vistas

Recibí un error con el siguiente mensaje de excepción: UnicodeEncodeError: 'ascii' codec can't encode character u'\ufeff' in position 155: ordinal not in range(128) No estoy seguro de qué u'\ufeff'es, aparece

Tengo una cadena Unicode en Python y me gustaría eliminar todos los acentos (diacríticos). Encontré en la web una manera elegante de hacer esto (en Java): convertir la cadena Unicode

¿Cómo funciona el texto Zalgo?

2
respuestas
733
votos
216.0k
vistas

He visto un texto con un formato extraño llamado Zalgo, como el siguiente, escrito en varios foros. Es un poco molesto de ver, pero realmente me molesta porque socava mi

La mejor manera de invertir una cadena

53
respuestas
577
votos
1.0M
vistas

Tuve que escribir una función inversa de cadena en C# 2.0 (es decir, LINQ no disponible) y se me ocurrió esto: public string Reverse(string text) { char[] cArray = text.ToCharArray();

Configurar la codificación de salida predeterminada en Python 2 es un modismo bien conocido: sys.stdout = codecs.getwriter("utf-8")(sys.stdout) Esto envuelve el sys.stdoutobjeto en un escritor de códec que codifica la salida

¿Cómo usar símbolos griegos en ggplot2?

4
respuestas
156
votos
vistas

Mis categorías deben nombrarse con letras griegas. Estoy usando ggplot2y funciona muy bien con los datos. Desafortunadamente, no puedo entender cómo poner esos símbolos griegos en el eje x (en

Aprendí de Google que la internacionalización es el proceso mediante el cual puedo hacer que mi aplicación web utilice todos los idiomas. Quiero entender Unicode para el proceso de internacionalización,

¿Qué son Unicode, UTF-8 y UTF-16?

0
respuestas
493
votos
375.0k
vistas

¿Cuál es la base de Unicode y por qué es necesario UTF-8 o UTF-16? Investigué esto en Google y busqué aquí también, pero no me queda claro. En VSS ,

Tengo cierta insuficiencia cerebral para comprender la lectura y escritura de texto en un archivo (Python 2.4). # The string, which has an a-acute in it. ss = u'Capit\xe1n' ss8

¿Cómo puedo convertir esta cadena? This string contains the Unicode character Pi(π) en una cadena ASCII con escape: This string contains the Unicode character Pi(\u03a0) y viceversa ? La codificación

desarrolladores! Quiero hacer un programa en Python que convierta símbolos del latín al cirílico. Por ejemplo: "ghbdtn" a "привет", que significa "hola" en ruso. ¿Alguien conoce algún método que pueda

Mientras hacía esta pregunta , me di cuenta de que no sabía mucho sobre cadenas sin formato. Para alguien que dice ser entrenador de Django, esto apesta. Sé lo que

Diferencias de formato Unicode, UTF, ASCII, ANSI

2
respuestas
400
votos
349.5k
vistas

¿ Cuál es la diferencia entre las codificaciones Unicode, UTF8, UTF7, UTF16, UTF32, ASCIIy ?ANSI ¿De qué manera son útiles para los programadores?

UTF-8, UTF-16 y UTF-32

14
respuestas
652
votos
326.2k
vistas

¿Cuáles son las diferencias entre UTF-8, UTF-16 y UTF-32? Entiendo que todos almacenarán Unicode y que cada uno usa una cantidad diferente de bytes para representar un carácter. ¿Hay alguna