Editor de texto para abrir archivos de texto grandes (gigantes, enormes, grandes) [cerrado]

Resuelto Dave Jarvis asked hace 16 años • 2 respuestas

Me refiero a más de 100 MB de tamaño; Estos archivos de texto pueden superar los límites de los editores.

Necesito revisar un archivo XML grande, pero no puedo si el editor tiene errores.

¿Alguna sugerencia?

Dave Jarvis avatar Oct 02 '08 03:10 Dave Jarvis
Aceptado

Visores gratuitos de solo lectura:

  • Visor de archivos de texto grandes (Windows): temas totalmente personalizables (colores, fuentes, ajuste de texto, tamaño de pestaña). Admite vista dividida horizontal y vertical. También admite seguimiento de archivos y búsqueda de expresiones regulares. Muy rápido, simple y tiene un tamaño ejecutable pequeño.
  • klogg (Windows, macOS, Linux): una bifurcación mantenida de glogg . Su característica principal es la búsqueda de expresiones regulares. Admite monitorear cambios de archivos (comotail), marcadores, resaltar patrones usando diferentes colores y tiene importantes optimizaciones incorporadas. Pero desde el punto de vista de la interfaz de usuario, es bastante mínimo.
  • LogExpert (Windows): "Un reemplazo de GUI paratail". Es realmente un analizador de archivos de registro, no un visor de archivos grandes, y en una prueba se necesitaron 10 segundos y 700 MB de RAM para cargar un archivo de 250 MB. Pero sus características principales son el columnizador (analiza registros que están en CSV, JSONL, etc. y los muestra en formato de hoja de cálculo) y el resaltador (muestra líneas con ciertas palabras en ciertos colores). También admite seguimiento de archivos, pestañas, archivos múltiples, marcadores, búsqueda, complementos y herramientas externas.
  • Lister (Windows) – Muy pequeño y minimalista. Es un ejecutable, apenas 500 KB, pero aún admite búsquedas (con expresiones regulares), impresión, un modo de editor hexadecimal y configuraciones.

Editores gratuitos:

  • Su editor o IDE habitual. Los editores modernos pueden manejar archivos sorprendentemente grandes. En particular, Vim (Windows, macOS, Linux), Emacs (Windows, macOS, Linux), Notepad++ (Windows), Sublime Text (Windows, macOS, Linux) y VS Code (Windows, macOS, Linux) admiten tamaños grandes (~ 4 GB), suponiendo que tenga RAM.
  • Editor de archivos grandes (Windows): abre y edita archivos TB+, admite Unicode, utiliza poca memoria, tiene funciones específicas de XML e incluye un modo binario.
  • GigaEdit (Windows): admite búsquedas, estadísticas de caracteres y personalización de fuentes. Pero tiene errores: con archivos grandes, sólo permite sobrescribir caracteres, no insertarlos; no respeta LF como terminador de línea, solo CRLF; y es lento.

Programas integrados (no requiere instalación):

  • less (macOS, Linux): la herramienta tradicional de buscapersonas de línea de comandos de Unix. Le permite ver archivos de texto de prácticamente cualquier tamaño. También se puede instalar en Windows.
  • Bloc de notas (Windows): decente con archivos grandes, especialmente con el ajuste de texto desactivado.
  • MÁS (Windows): esto se refiere a WindowsMORE, no a Unixmore. Un programa de consola que le permite ver un archivo, una pantalla a la vez.

Visitantes web:

  • readfileonline.com : otro visor de archivos grandes HTML5. Soporta búsqueda.

Editores/espectadores pagos:

  • 010 Editor (Windows, macOS, Linux): abre archivos gigantes (hasta 50 GB).
  • SlickEdit (Windows, macOS, Linux): abre archivos grandes.
  • UltraEdit (Windows, macOS, Linux): abre archivos de más de 6 GB, pero se debe cambiar la configuración para que esto sea práctico: Menú » Avanzado » Configuración » Manejo de archivos » Archivos temporales » Abrir archivo sin archivo temporal...
  • EmEditor (Windows): maneja bien archivos de texto muy grandes (oficialmente hasta 16 TB). La velocidad de búsqueda y reemplazo es muy rápida. Versión gratuita disponible para uso personal.
  • BssEditor (Windows): maneja archivos grandes y líneas muy largas. No requiere instalación. Gratis para uso no comercial.
  • loxx (Windows): admite seguimiento de archivos, resaltado, números de línea, archivos grandes, expresiones regulares, múltiples archivos y vistas, y mucho más. La versión gratuita no puede: procesar expresiones regulares, filtrar archivos, sincronizar marcas de tiempo y guardar archivos modificados.
MultiplyByZer0 avatar Oct 01 '2008 20:10 MultiplyByZer0

Consejos y trucos

menos

¿Por qué utiliza editores para simplemente mirar un archivo (grande)?

Bajo *nix o Cygwin , simplemente use less . (Hay un dicho famoso: "menos es más, más o menos", porque "menos" reemplazó al comando anterior de Unix "más", con la adición de que se podía desplazar hacia arriba). Buscar y navegar bajo menos es muy similar a Vim, pero no hay ningún archivo de intercambio y se utiliza poca RAM.

Hay un puerto Win32 de GNU menos. Consulte la sección "menos" de la respuesta anterior.

perla

Perl es bueno para secuencias de comandos rápidas, y su ..operador (flip-flop de rango) constituye un buen mecanismo de selección para limitar la basura que tiene que atravesar.

Por ejemplo:

$ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less

Esto extraerá todo, desde la línea 1 millón hasta la línea 2 millones, y le permitirá filtrar la salida manualmente en menos.

Otro ejemplo:

$ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less

Esto comienza a imprimirse cuando la "expresión regular uno" encuentra algo y se detiene cuando la "expresión regular dos" encuentra el final de un bloque interesante. Puede encontrar varios bloques. Tamizar la salida...

analizador de registros

Esta es otra herramienta útil que puedes utilizar. Para citar el artículo de Wikipedia :

logparser es una utilidad de línea de comandos flexible que fue escrita inicialmente por Gabriele Giuseppini, un empleado de Microsoft, para automatizar pruebas de registro de IIS. Estaba pensado para su uso con el sistema operativo Windows y se incluía con las herramientas del kit de recursos de IIS 6.0. El comportamiento predeterminado de logparser funciona como una "canalización de procesamiento de datos", tomando una expresión SQL en la línea de comando y generando las líneas que contienen coincidencias para la expresión SQL.

Microsoft describe Logparser como una herramienta potente y versátil que proporciona acceso de consulta universal a datos basados ​​en texto, como archivos de registro, archivos XML y archivos CSV, así como fuentes de datos clave en el sistema operativo Windows, como el registro de eventos, el registro, el sistema de archivos y Active Directory. Los resultados de la consulta de entrada pueden tener un formato personalizado en una salida basada en texto o pueden persistir en objetivos más especializados como SQL, SYSLOG o un gráfico.

Uso de ejemplo:

C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"

La relatividad de los tamaños.

100 MB no es demasiado. 3 GB se están volviendo algo grandes. Solía ​​​​trabajar en una instalación de impresión y correo que generaba alrededor del 2% del correo de primera clase de EE. UU. Uno de los sistemas del que yo era líder técnico representaba aproximadamente más del 15 % de los mensajes de correo. Teníamos algunos archivos grandes para depurar aquí y allá.

Y más...

No dude en agregar más herramientas e información aquí. ¡Esta respuesta es wiki comunitaria por una razón! Todos necesitamos más consejos sobre cómo manejar grandes cantidades de datos...

MultiplyByZer0 avatar Aug 27 '2009 20:08 MultiplyByZer0