PK Systems PK Systems
Herramientas de texto

Removedor de HTML

Pega cualquier HTML y obtén texto plano, limpio y legible — etiquetas removidas, entidades decodificadas, espacios ajustados.

Removedor de HTML

Texto plano

Qué hace esta herramienta

Pega un fragmento de HTML — directo del código fuente de una página, de una plantilla de correo, de la exportación de un CMS o de una página que copiaste con formato — y obtén texto plano legible al otro lado. Las etiquetas de bloque se vuelven saltos de línea, <br> se vuelve nueva línea, las etiquetas de ancla pueden conservar su URL entre paréntesis, y las entidades nombradas/numéricas (&amp;, &#x2014;) se decodifican a caracteres reales.

Cómo usar el removedor

Pega tu HTML en el campo de entrada. La salida en texto plano se actualiza mientras escribes. Usa Mantener URLs de enlaces para preservar los hrefs de las <a> entre paréntesis tras el texto del enlace — útil para versiones imprimibles. Compactar espacios reduce las secuencias de espacios y líneas en blanco que vienen del HTML indentado, y Recortar quita los espacios al inicio y al final del texto. Haz clic en Copiar para llevar el resultado al portapapeles.

Cuándo usar esta herramienta

Limpiar contenido pegado de una página web (que suele venir con <span> sueltos y estilos en línea), preparar copy para un boletín a partir de un borrador HTML, generar alt-text desde bloques de contenido enriquecido, o simplemente revisar el contenido legible de un fragmento de marcado. La salida sirve donde se requiera texto plano: correos sin formato, terminal, descripciones para buscadores o análisis de longitud.

Ejemplos

Entrada Salida
<p>Hello <b>world</b></p>Hello world
Line one<br>Line twoLine one
Line two
<ul><li>A</li><li>B</li></ul>A
B
<a href="x.com">Site</a>Site (x.com)
&amp; &quot;& "

Preguntas frecuentes

¿Quita todas las etiquetas?
Sí — se elimina cada etiqueta HTML. Las etiquetas de bloque (<p>, <div>, <li>, encabezados, etc.) se convierten en saltos de línea, así que las separaciones de párrafo se preservan. <br> también pasa a salto de línea. <script>, <style> y similares descartan su contenido por completo, que es lo que casi siempre se quiere.
¿Se decodifican las entidades HTML?
Sí. Tanto entidades nombradas (&amp;, &quot;, &mdash;, &ndash;, &hellip;, etc.) como numéricas (&#8211;, &#x2014;) se convierten a los caracteres reales. Es decir, &amp; se vuelve &, y &mdash; se vuelve un guion largo de verdad.
¿Qué hace Mantener URLs de enlaces?
Cuando está activo, <a href="https://example.com">sitio</a> se vuelve sitio (https://example.com) en lugar de solo sitio. Útil para imprimir o donde el lector no puede hacer clic. Cuando está apagado, solo se mantiene el texto visible y la URL se descarta.
¿Cómo se manejan los espacios en blanco?
Por defecto, las secuencias de espacios/tabs se compactan a un solo espacio, y tres o más líneas en blanco se compactan a dos. Cada línea también se recorta de espacios finales. Apaga Compactar espacios para ver exactamente lo que salió del parser, con los saltos originales del HTML preservados.
¿Puedo pegar una página HTML completa?
Sí. Los bloques <script>, <style>, <noscript>, <template> y <iframe> tienen su contenido descartado, así que la salida es el texto legible de la página — aproximadamente lo que vería un lector de pantalla o un buscador. Para páginas muy grandes, la conversión sigue terminando en tu navegador, sin viaje al servidor.
¿Mi HTML se sube a algún lado?
No. El removedor corre por completo en tu navegador usando regex sobre cadenas — sin renderizado del DOM, sin fetch, sin subida. Seguro para plantillas internas de correo, borradores de artículos o cualquier marcado que no quieras filtrar.