Preguntas con la etiqueta [unicode]

Lista unicode preguntas

¿Cuál es la herramienta o método más rápido y sencillo para convertir archivos de texto entre conjuntos de caracteres? Específicamente, necesito convertir de UTF-8 a ISO-8859-15 y viceversa. Todo vale:

Estoy intentando escribir un validador razonablemente permisivo para nombres en PHP y mi primer intento consiste en el siguiente patrón: // unicode letters, apostrophe, hyphen, space $namePattern = "/^([\\p{L}'\\- ])+$/";

Tengo problemas para tratar con caracteres Unicode de texto obtenido de diferentes páginas web (en diferentes sitios). Estoy usando BeautifulSoup. El problema es que el error no siempre es reproducible;

Entre utf8_general_ciy utf8_unicode_ci, ¿hay diferencias en cuanto a rendimiento?

¿Cómo busco todos los caracteres que no son ASCII?

16
respuestas
429
votos
359.0k
vistas

Tengo varios archivos XML muy grandes y estoy intentando encontrar las líneas que contienen caracteres que no son ASCII. Intenté lo siguiente: grep -e "[\x{00FF}-\x{FFFF}]" file.xml Pero esto devuelve cada

Quiero un comando de Linux para imprimir estructuras de directorios y archivos en forma de árbol, posiblemente con íconos Unicode antes de cada archivo, y alguna sugerencia sobre la mejor