Eliminar líneas que no contienen palabras específicas con Notepad ++

2015-10-20 00:23:36
Principal·Software·Eliminar líneas que no contienen palabras específicas con Notepad ++

Se supone que la computadora nos ayuda a hacer las cosas más fáciles. Un ejemplo simple es eliminar líneas de un archivo de texto que no contiene una palabra clave específica. Esta tarea es obvia pero requiere mucho tiempo y es tediosa. Recientemente, pasé algún tiempo compilando una lista de sitios web que ha copiado y publicado artículos tomados de este blog a su sitio web. Aunque Google hace un trabajo bastante bueno para determinar el editor original, sigue siendo un robot basado en un montón de algoritmos que cambian constantemente y que pueden cometer errores. La búsqueda de sitios web que han copiado las publicaciones desde aquí lleva mucho tiempo, por lo que he utilizado Copyscape Premium para realizar automáticamente un análisis por lotes en los 2000 artículos de este sitio web para rastrear el plagio del contenido de este blog.

Copyscape Premium terminó de escanear las 2000 publicaciones en solo 10 horas y pude exportar los resultados a un archivo CSV para una mayor investigación. Hay más de 20, 000 URL en la lista y quiero clasificar los sitios web en función de los nombres de dominio. No todos los sitios web de la lista son imitadores, pero la mayoría de los sitios web alojados en servidores gratuitos como blogspot / blogger / wordpress son raspadores o copiadores. Una vez que se clasifican las URL, puedo concentrarme en presentar una queja de DMCA a Blogger, y luego WordPress en lugar de saltar de un lado a otro. Los usuarios de Linux pueden eliminar fácilmente líneas que no contienen palabras específicas mediante el comando global ex, pero desafortunadamente necesitamos un software para hacerlo en Windows. Como soy un usuario de Notepad ++, descubrí que es posible eliminar líneas automáticamente usando Notepad ++ cuando la palabra especificada por usted no está presente. Aquí hay un ejemplo sobre cómo eliminar líneas que no contienen la palabra "blogspot.com" o, en otras palabras, solo quiero mantener las líneas que contienen la palabra "blogspot".

1. Ejecute Notepad ++, abra el archivo de texto que desea editar o pegue el texto en la página vacía.
2. Vaya a Buscar barra de menú y seleccione Buscar
3. Vaya a la pestaña Marcar, marque la casilla de verificación Línea de marcador, ingrese blogspot.com en el cuadro Buscar y haga clic en el botón Marcar todo. Se agregará un icono azul a la línea que contiene la palabra blogspot.com

4. Cierre la ventana de Mark.
5. Vaya a Buscar barra de menú> Marcador> y seleccione Eliminar líneas sin marcar

Si el archivo de texto que está editando es muy grande, el proceso puede demorar un poco. Alternativamente, también puede seleccionar Eliminar líneas marcadas de Buscar> Marcador si está intentando eliminar líneas que contienen las palabras que especifique. Vea el video incrustado a continuación si tiene problemas para seguir las instrucciones paso a paso sobre cómo eliminar líneas sin las palabras clave usando Notepad ++.

La Elección Del Editor