You are on page 1of 31

Calibre tiene un sistema de conversin que est diseado para ser muy fcil de usar.

Normalmente, usted slo tiene que aadir un libro de calibre, haga clic en convertir y el calibre se esforzaran para generar una salida que es lo ms cercano posible a la entrada. Sin embargo, el calibre acepta un nmero muy grande de formatos de entrada y no todos son adecuados para la conversin a otros libros electrnicos. En el caso de formatos de entrada tales, o si simplemente desea un mayor control sobre el sistema de conversin, el calibre tiene un montn de opciones para ajustar el proceso de conversin. Note sin embargo que el sistema de conversin de calibre no es un sustituto de un editor de libros electrnicos por completo soplado. Para editar libros electrnicos, yo recomendara primero convertirlos a EPUB con calibre y luego con un editor dedicado EPUB, como Sigil para obtener el libro en perfecto estado. A continuacin, puede utilizar el EPUB editado como entrada para la conversin a otros formatos en el calibre. Este documento se refiere principalmente a los ajustes de conversin que se encuentran en el cuadro de dilogo de conversin, se muestra a continuacin. Todas estas opciones tambin estn disponibles a travs de la interfaz de lnea de comandos a la conversin, documentado en el libro electrnico-converso. En calibre, puede obtener ayuda en cualquier nivel individual por la celebracin de su ratn sobre l, un texto de ayuda aparecer la descripcin del entorno

Contenido
Introduccin Look & Feel Configuracin de pgina Heurstica de procesamiento Buscar y reemplazar Estructura de deteccin de Tabla de contenidos Uso de imgenes como ttulos de los captulos, cuando la conversin de documentos HTML de entrada Cmo se configuran las opciones / guardar para la Conversin Formato especficas de consejos

Lo primero a entender en cuenta sobre el sistema de conversin es que est diseado como una tubera. Esquemticamente, se parece a esto:

El formato de entrada se convierte primero en XHTML mediante el plug-in de entrada apropiado. Este cdigo HTML se transforma. En el ltimo paso, el XHTML procesada se convierte en el formato de salida especificado por el complemento de salida apropiado. Los resultados de la conversin puede variar enormemente, basado en el formato de entrada. Algunos formatos de conversin mucho mejor que otros. Una lista de los mejores formatos de fuente para la conversin est disponible aqu. Las transformaciones que actan sobre la salida de XHTML es donde sucede todo el trabajo. Hay varias transformaciones, por ejemplo, para insertar metadatos libro como una pgina al comienzo del libro, para la deteccin de ttulos de los captulos y crear automticamente una tabla de contenido, para ajustar proporcionalmente los tamaos de fuente, etctera. Es importante que todos los remeber las transformaciones actan sobre la salida de XHTML por el plug-in de entrada, no en el propio archivo de entrada. As, por ejemplo, si usted lo pide calibre para convertir un archivo RTF a EPUB, que se convertirn primero a XHTML internamente, las transformaciones diferentes se aplicar el XHTML y el plug-in de salida va a crear el archivo EPUB, la generacin automtica de todos los metadatos , Tabla de contenidos, etc.

Usted puede ver este proceso en accin mediante el uso de la opcin de depuracin. Slo especifique la ruta de acceso a un directorio para

la salida de depuracin. Durante la conversin, calibre coloca el XHTML generado por las diversas etapas de la tubera de conversin en diferentes sub-directorios. Los cuatro sub-directorios son los siguientes:

Etapas del Proceso de conversin


Directorio Descripcin

Entrada

Este contiene la salida HTML del plugin de entrada. Utilice esta opcin para depurar el plugin de entrada. El resultado de la pre-procesamiento y conversin a XHTML la salida del plugin de entrada. Se utiliza para depurar deteccin de la estructura. Mensaje de deteccin de la estructura, pero antes de la conversin de CSS tamao de aplanamiento y la fuente. Se utiliza para depurar el tamao de fuente de conversin y las transformaciones CSS.

Analizado

Estructura

Justo antes de que el libro electrnico se pasa el plugin de Procesamiento salida. Se utiliza para depurar el Plugin de salida. Si desea editar el documento de entrada un poco antes de que tenga calibre de convertir, la mejor cosa a hacer es editar los archivos en el subdirectorio de entrada, a continuacin, cerrar la cremallera, y utilizar el archivo zip como formato de entrada para conversiones posteriores. Para ello el uso de la meta de dilogo Editar informacin para agregar el archivo zip como un formato para el libro y, a continuacin, en la esquina superior izquierda del cuadro de dilogo de conversin, seleccione ZIP como el formato de entrada. En este documento se refieren principalmente a las transformaciones diversas que operan en el intermedio de XHTML y cmo controlarlos. Al final se presentan algunos consejos especficos para cada entrada / salida en formato.

Contenido
Tamao de la fuente reescalar el espacio entre prrafos Extra CSS Varios Principio del formulario Este grupo de opciones controla diversos aspectos de la apariencia y la sensacin de que el libro electrnico a convertir.

Reajuste tamao de la fuente


Una de las caractersticas ms agradables de la experiencia de lectura electrnica es la posibilidad de ajustar fcilmente los tamaos de fuente para satisfacer las necesidades individuales y las condiciones de iluminacin. calibre tiene algoritmos sofisticados para garantizar que todos los libros que las salidas tienen un tamao de las fuentes consistentes, sin importar lo que los tamaos de fuente se especifican en el documento de entrada. El tamao base de un documento es el tamao de la fuente ms comn en dicho documento, es decir, el tamao de la mayor parte de texto en dicho documento. Cuando se especifica un tamao de fuente base, calibre automticamente cambia la escala de todos los tamaos de fuente en el documento de forma proporcional, de modo que el tamao de la fuente ms comn se convierte en el tamao de la base de la fuente especificada y otros tamaos de fuente se reajustarn adecuadamente. Al elegir un tamao de la base de la fuente ms grande, usted puede hacer que las fuentes en el documento de mayor tamao y viceversa. Cuando se establece el tamao de la fuente de base, para obtener mejores resultados, tambin debe establecer la clave del tamao de la fuente. Normalmente, el calibre seleccionar automticamente un tamao de fuente base apropiada para el perfil de salida que haya elegido (ver Configuracin de pgina). Sin embargo, puede anular esta aqu en caso de que el defecto no es adecuado para usted. El tamao de la fuente opcin de tecla le permite controlar la forma de base no se reajustarn los tamaos de fuente. El algoritmo de cambio de escala de la fuente funciona mediante una clave de tamao de la fuente, que es simplemente una lista separada por comas de los tamaos de fuente. La clave de tamao de la fuente le dice a calibre de la cantidad de "pasos" ms grande o ms pequeo un determinado tamao de letra debe ser comparado con el tamao de la fuente base. La idea es que debe haber un nmero

limitado de tamaos de fuente en un documento. Por ejemplo, un tamao para el texto del cuerpo, un par de tamaos para los diferentes niveles de las partidas y un par de tamaos para los scripts de super / sub y notas al pie. La clave de tamao de la fuente permite calibre a compartimentar los tamaos de fuente en los documentos de entrada en recipientes separados "" correspondiente al tamao de las fuentes lgicas diferentes. Vamos a ilustrar con un ejemplo. Supongamos que el documento de origen que se estn convirtiendo fue producido por alguien con una vista excelente y tiene un tamao de fuente base de 8 puntos. Eso significa que la mayor parte del texto en el documento tiene un tamao de 8pts, mientras que las partidas son algo ms grandes (por ejemplo 10 y 12 puntos) y algo menor en el pie de pgina 6 pt. Ahora bien, si se utilizan los siguientes parmetros:
Base font size : 12pt Font size key : 7, 8, 10, 12, 14, 16, 18, 20

El documento de salida tendr un tamao de fuente base de 12pt, partidas de 14 y 16 puntos y notas al pie de 8 puntos. Ahora bien, supongamos que queremos hacer el mayor tamao de la partida se destacan ms y hacer las notas al pie un poco ms grande tambin. Para lograr esto, la tecla de letra debe ser cambiado a:
New font size key : 7, 9, 12, 14, 18, 20, 22

Las mayores partidas se convertir ahora en 18 puntos, mientras que las notas se convertir en 9 puntos. Puedes jugar con estos ajustes para tratar de averiguar lo que sera ptimo para usted utilizando el asistente para cambio de escala de la fuente, que se puede acceder haciendo clic en el pequeo botn junto a la configuracin de fuente clave de tamao. Todo el reescalar el tamao de fuente en la conversin tambin se puede desactivar aqu, si desea mantener los tamaos de fuente en el documento de entrada. Un valor relacionado es la altura de la lnea. La altura de lnea controla la altura vertical de las lneas. Por defecto, (a la altura de la lnea de 0), sin manipulacin de la lnea de alturas se lleva a cabo. Si se especifica un valor no predeterminado, la altura de la lnea se establecer en todos los lugares que no especifican sus alturas de lneas propias. Sin embargo, esto es algo de un arma contundente y deben utilizarse con moderacin. Si desea ajustar la altura de la lnea de algn sector de la entrada, es mejor usar el CSS extra Principio del formulario

Espaciado De Prrafo
Normalmente, los prrafos en XHTML se representan con una lnea en blanco entre ellos y no hay texto principal guin. Calibre tiene un par de opciones para controlar esto. Quitar espacio entre prrafos fuerza asegurarse de que todos los prrafos no tienen ningn espacio entre prrafos. Tambin establece el texto guin de 1.5em (se puede cambiar) para marcar el inicio de cada prrafo. Insertar lnea en blanco hace lo contrario, lo que garantiza que no es exactamente una lnea en blanco entre cada par de prrafos. Ambas opciones son muy amplias, la eliminacin de espacios, o introducirla para todos los prrafos tcnicamente <p> y <div>). Esto es para que usted pueda establecer la opcin y asegurarse de que se lleva a cabo segn lo anunciado, independientemente de la forma desordenada en el archivo de entrada es. La nica excepcin es cuando el archivo de entrada utiliza saltos de lnea para aplicar espaciado entre prrafos. Si desea eliminar el espacio entre todos los prrafos, a excepcin de unos pocos elegidos, no use estas opciones. En su lugar aadir el siguiente cdigo CSS para CSS extra:
p, div { margin: 0pt; border: 0pt; text-indent: 1.5em } .spacious { margin-bottom: 1em; text-indent: 0pt; }

Luego, en el documento de origen, marcar los puntos que necesitan espacio con class = "espaciosa". Si el documento de entrada no es en HTML, utilice la opcin de depuracin, que se describe en la Introduccin para obtener HTML (utilizar la entrada de sub-directorio).

Extra CSS
Esta opcin le permite especificar CSS arbitraria que se aplicar a todos los archivos HTML en la entrada. Este CSS se aplica con prioridad muy alta y por lo tanto debe pasar por encima la actualidad la mayora de CSS en el documento de entrada en s. Puede usar este ajuste para ajustar la presentacin / diseo del documento. Por ejemplo, si desea que todos los prrafos de la nota final de clase estn alineados a la derecha, slo tiene que aadir:
.endnote { text-align: right }

o si desea cambiar la sangra de los prrafos:


p { text-indent: 5mm; }

Extra CSS es una opcin muy potente, pero s es necesario un entendimiento de cmo funciona CSS para usarlo en todo su potencial. Puede utilizar la opcin de tuberas de depuracin que se ha descrito anteriormente para ver lo que CSS est presente en su documento de entrada.

Varios
Hay algunas opciones ms en esta seccin. Sin la justificacin del texto Normalmente, si el formato de salida que soporta, calibre har que el libro electrnico de salida para que el texto justificado (es decir, un margen derecho sin problemas). Esta opcin se apagar este comportamiento, en cuyo caso cualquier justificacin se especifica en el documento de entrada se utiliza en su lugar. Alinear las tablas Algunos documentos mal diseados utilizan tablas para controlar la disposicin del texto en la pgina. Cuando se convierten, a menudo estos documentos de texto hacen que se salgan de la pgina y otros artefactos. Esta opcin va a extraer el contenido de las tablas y presentarlo de una forma lineal. Tenga en cuenta que esta opcin alinea todas las tablas, por lo que slo se use si est seguro de que el documento de entrada no utiliza tablas para propsitos legtimos, como la presentacin de la informacin tabular. Transliterar los caracteres Unicode Transliterar caracteres Unicode en una representacin ASCII. Usar con cuidado, ya que esto sustituya los caracteres Unicode con ASCII. Por ejemplo, se sustituir " " con "Mikhail Gorbachiov". Adems, tenga en cuenta que en los casos en los que hay mltiples representaciones de un carcter (caracteres compartidos por los chinos y los japoneses, por ejemplo) la representacin utilizada por el mayor nmero de personas que sern utilizados (en chino en el ejemplo anterior). Esta opcin es til sobre todo si usted va a ver el libro electrnico en un dispositivo que no tiene soporte para Unicode. Codificacin de caracteres de entrada Los documentos ms antiguos a veces no se especifican la codificacin de caracteres. Cuando se convierte, esto puede resultar en caracteres no ingleses o caracteres especiales como comillas tipogrficas ser daados. calibre intenta detectar automticamente la codificacin de caracteres del documento de origen, pero no "tener xito siempre. Puede forzar a que

asuma una codificacin de caracteres en particular mediante el uso de esta opcin. cp1252 es una codificacin comn para los documentos elaborados utilizando el software de Windows. Tambin debera leer Cmo puedo convertir mi archivo que contiene caracteres no ingleses, o las cotizaciones inteligentes? Para ms informacin sobre problemas de codificacin.

Configurar pgina
Las opciones de configuracin de pgina son para controlar el tamao de la pantalla, al igual que los mrgenes y tamaos de pantalla. Hay opciones para configurar los mrgenes de pgina, que sern utilizados por el Plugin de salida, si el formato de salida seleccionado admite mrgenes de la pgina. Adems, usted debe elegir un perfil de entrada y un perfil de salida. Ambos conjuntos de perfiles, bsicamente, hacer frente a la forma de interpretar las mediciones en los documentos de entrada / salida, tamaos de pantalla y las teclas de fuentes predeterminadas reescalar. Si usted sabe que el archivo est convirtiendo estaba destinado a ser utilizado en un determinado dispositivo / plataforma de software, seleccione el perfil de entrada correspondiente, de lo contrario slo elegir el perfil de entrada por defecto. Si conoces a los archivos que se estn produciendo son para un tipo de dispositivo, seleccione el perfil de salida correspondiente. En particular, para los archivos de salida MOBI, usted debe elegir el Kindle, el lector de LIT de Microsoft y para el EPUB el Sony Reader. En el caso de EPUB, el perfil de Sony Reader se traducir en archivos EPUB que funcionarn en todas partes. Sin embargo, tiene algunos efectos secundarios, como la insercin de saltos de seccin artificiales para mantener los componentes internos por debajo del umbral de tamao, necesario para los dispositivos de Sony. En particular, para los telfonos iPhone / Android, elegir el perfil de salida SONY. Si usted sabe que sus archivos EPUB no se puede leer en un dispositivo Sony o similar, utilizar el perfil de salida por defecto. Si usted est produciendo archivos MOBI que no estn destinados para el Kindle, seleccione el perfil de salida de los libros Mobipocket. El perfil de salida tambin se controla el tamao de la pantalla. Esto har que, por ejemplo, las imgenes a ser auto-redimensionada para estar en forma a la pantalla en algunos formatos de salida. As que elige un perfil de un dispositivo que tiene un tamao de pantalla similar a su dispositivo.

Procesamiento heurstico
Procesamiento heurstico ofrece una variedad de funciones que pueden ser utilizados para tratar de detectar y corregir problemas comunes en los documentos de entrada mal formateados. Utilice estas funciones si su

documento de entrada sufre de formatos pobres. Dado que estas funciones se basan en patrones comunes, tenga en cuenta que en algunos casos, una opcin puede dar lugar a peores resultados, a fin de utilizar con cuidado. A modo de ejemplo, varias de estas opciones se eliminarn todas las entidades de no separacin de espacios, o pueden incluir falsas coincidencias positivas en relacin a la funcin. Habilitar el procesamiento heurstico Esta opcin activa la fase de procesamiento heurstico del calibre de la tubera de conversin. Esto debe ser habilitado para que los diversos subfunciones que deben aplicarse Separar lneas Al habilitar esta opcin har que el calibre para tratar de detectar y corregir los saltos de lnea que existen dentro de un documento con pistas de puntuacin y la longitud de la lnea. calibre primero intentar detectar si existen saltos de lnea, si es que no parecen existir calibre no intentar Separar lneas. El factor de la lnea de unwrap se puede reducir si se quiere calibre de "fuerza" para desenvolver lneas. Line-Separar el factor Esta opcin controla el calibre algoritmo utiliza para eliminar los saltos de lnea dura. Por ejemplo, si el valor de esta opcin es de 0,4, lo que significa calibre eliminar saltos de lnea desde el final de las lneas cuyas longitudes son menores que la longitud de 40% de todas las lneas en el documento. Si el documento slo tiene algunos saltos de lnea, que necesitan correccin, este valor debe ser reducido a entre 0,1 y 0,2. Detectar y las partidas de marcado sin formato de los captulos y subttulos Si el documento no tiene ttulos de los captulos y ttulos con formato diferente al resto del texto, el calibre puede utilizar esta opcin para intentar la deteccin de ellos y rodearlos con etiquetas de ttulo. etiquetas <h2> se utilizan para ttulos de los captulos; etiquetas <h3> se utilizan para los ttulos que se detecten. Esta funcin no va a crear una tabla de contenido, pero en muchos casos, har que la configuracin predeterminada del calibre de deteccin de los captulos para detectar correctamente los captulos y construir una tabla de contenido. Ajuste el XPath en Deteccin de la estructura, si una tabla de contenido no se crea automticamente. Si no hay otras partidas utilizadas en el documento a continuacin, establecer "/ / h: H2" en Deteccin de la estructura sera la manera ms fcil para crear una tabla de contenido para el documento. Los ttulos insertados no estn formateados, para aplicar formato de utilizar

la opcin adicional de CSS bajo la apariencia y la configuracin de conversin. Por ejemplo, para las etiquetas del centro de la partida, utilice la siguiente:
h2, h3 { text-align: center }

Cambiar la numeracin de secuencias de <h1> o <h2> Algunos editores de las partidas en formato de captulo utilizando <h1> mltiple o etiquetas <h2> secuencialmente. La configuracin por defecto de conversin de calibre har que estos ttulos se dividan en dos partes. Esta opcin se volver a numerar las etiquetas de ttulo para evitar separaciones. Eliminar lneas en blanco entre prrafos Esta opcin har que el calibre de analizar las lneas en blanco que se incluyen en el documento. Si todos los prrafos se intercala con una lnea en blanco, a continuacin, calibre eliminar todos aquellos prrafos en blanco. Las secuencias de mltiples lneas en blanco se considerarn cambios de escena y se retendrn en un solo prrafo. Esta opcin difiere de la opcin "Eliminar espacio entre prrafos" en "Look and Feel ', ya que en realidad modifica el contenido HTML, mientras que la otra opcin modifica los estilos del documento. Esta opcin tambin puede eliminar los prrafos que fueron insertados con la opcin del calibre de 'Insertar lnea en blanco ". Asegrese de cambios de escena son constantemente formato Con este calibre opcin intentar detectar la rotura comunes escena marcadores y velar por su centro alineado. 'Suaves' de los marcadores de descanso de escena, es decir, la escena se rompe slo se define por el espacio en blanco, son de estilo para asegurarse de que no se mostrar en conjunto con los saltos de pgina. Reemplazar saltos de escena Si esta opcin se configura entonces calibre reemplazar marcadores de escenas descanso que encuentra el texto de reemplazo especificados por el usuario. Por favor, tenga en cuenta que algunos caracteres ornamentales pueden no ser compatibles en todos los dispositivos de lectura. En general, usted debe evitar el uso de etiquetas HTML, el calibre se deseche cualquier etiqueta y el uso de pre-definida de marcas. <hr /> tags, es decir, las reglas horizontales y <img> son excepciones. Las reglas horizontales, opcionalmente, se puede especificar con los estilos, si usted elige para agregar su propio estilo, asegrese de incluir el 'ancho' Marco, de lo contrario la informacin de estilo ser descartado. Las etiquetas de imagen se pueden utilizar, pero de calibre no proporciona la capacidad de agregar la imagen durante la conversin, esto debe hacerse despus de los hechos a travs del "Libro de Tweak" caracterstica, o Sello.

Ejemplo de etiqueta de la imagen (lugar de la imagen dentro de la carpeta un 'Imgenes' dentro de la publicacin electrnica despus de la conversin): <img style="width:10%" src="../Images/scenebreak.png" /> Ejemplo Horizontal con estilos: <hr style="width:20%;padding-top: 1px;border-top: 2px 2px canto black;border-bottom: ranura black;"/> Quitar guiones innecesarios calibre se analiza todo el contenido con guin en el documento cuando se activa esta opcin. El propio documento se utiliza como un diccionario para su anlisis. Esto permite calibre para eliminar con precisin los guiones de las palabras en el documento en cualquier idioma, junto con palabras cientficas inventadas y oscuro. El principal inconveniente son las palabras que aparecen slo una sola vez en el documento no ser cambiado. Anlisis ocurre en dos pasos, el primer paso analiza los finales de lnea. Las lneas se desenvolvi slo si la palabra existe con o sin un guin en el documento. El segundo paso analiza todas las palabras separadas por guiones en todo el documento, los guiones se quitan si la palabra existe en otras partes del documento sin partido. En cursiva las palabras y patrones comunes Cuando est activado, el calibre ser buscar palabras y patrones comunes que denotan cursiva y cursiva ellos. Ejemplos de ello son las convenciones comunes de texto, como ~ ~ palabras o frases que por lo general se debe en cursiva, por ejemplo, frases en latn como 'etc' o 'etctera'. Vuelva a colocar guiones entidad con guiones CSS Algunos documentos utilizan una convencin de la definicin de guiones de texto a travs de no separacin entidades del espacio. Cuando esta opcin est activada calibre intentar detectar este tipo de formato y los convierte a un texto de 3% guin con css.

Buscar y reemplazar
Estas opciones son tiles sobre todo para la conversin de documentos en formato PDF o conversiones de OCR, aunque tambin puede utilizarse para corregir muchos problemas de documentos especficos. A modo de ejemplo, algunas conversiones dejan los encabezados y pies de pgina en el texto. Estas opcin permite usar expresiones regulares para tratar de detectar los encabezados, pies de pgina o el textos arbitrarios y eliminarlos o reemplazarlos por otros. Recuerde que operan en el XHTML intermedio producido por el oleoducto de conversin. Hay un asistente para ayudarle a personalizar las expresiones regulares para el documento. Haga clic en la varita mgica al lado de la caja de expresin, y haga clic en el botn 'Test'

despus de componer la expresin de bsqueda. Las expresiones encontradas se resaltarn en amarillo. La bsqueda funciona mediante el uso de una expresin regular pitn. Todo texto que coincide simplemente se elimina del documento o reemplazado utilizando el modelo de reemplazo. El modelo de reemplazo es opcional, si se deja en blanco a continuacin, el texto que coincida con el patrn de bsqueda se elimina del documento. Usted puede aprender ms acerca de las expresiones regulares y su sintaxis en absoluto sobre el uso de expresiones regulares en el calibre.

Deteccin de la estructura
La deteccin de la estructura implica que calibre hara todo lo posible para detectar elementos estructurales en el documento de entrada, cuando no se ha especificado correctamente. Por ejemplo, los captulos, saltos de pgina, encabezados, pies de pgina, etc Como se puede imaginar, este proceso vara mucho de un libro a otro. Afortunadamente, calibre tiene opciones muy potentes para controlar esto. Con el poder viene la complejidad, pero si una vez se tome el tiempo necesario para aprender la complejidad, se dar cuenta que bien vale la pena el esfuerzo.

Captulos y saltos de pgina


Calibre tiene dos conjuntos de opciones para la deteccin de captulo y la insercin de saltos de pgina. Esto a veces puede ser un poco confuso, ya que por defecto, calibre insertara saltos de pgina antes de captulos detectados, as como los lugares detectados por la opcin de los saltos de pgina. La razn de esto es que a menudo hay lugar donde los saltos de pgina se debe insertar que no son lmites de captulo. Adems, los captulos detectados pueden ser opcionalmente se inserta en la tabla de contenido generado automticamente. Calibre utiliza XPath, un lenguaje de gran alcance para permitir que el usuario especifique los lmites de los captulos o los saltos de pgina. XPath puede parecer un poco intimidante para usar en un primer momento, por suerte, hay un tutorial de XPath en el Manual del Usuario. Recuerde que la deteccin de la estructura opera en el XHTML intermedio producido por la canalizacin de la conversin. Utilice la opcin de depuracin descrito en la introduccin de averiguar los ajustes adecuados para su libro. Tambin hay un botn para un asistente de XPath para ayudar con la generacin de expresiones XPath simples. De forma predeterminada, calibre utiliza la siguiente expresin para la

deteccin del captulo: / / * [((Name () = 'H1' o el nombre de () = 'h2') y volver a:. De prueba ('captulo | Guas | seccin | parte \ s +', 'i')) o @ class = 'captulo'] Esta expresin es bastante complejo, ya que trata de manejar un nmero de casos comunes condiciones simultneamente. Lo que significa es que el calibre asumir captulos comienzan a partir de cualquiera de las etiquetas o <h1> <h2> que tengan cualquiera de las palabras (captulo, libro, artculo o parte) en ellos o que tienen la clase = "captulo" atributo. Una opcin es el captulo relacionado con la marca, que le permite controlar qu calibre hace cuando se detecta un captulo. Por defecto, se le insertar un salto de pgina antes del captulo. Puede tener que insertar una lnea rayada en lugar de, o adems de la ruptura de pgina. Usted tambin puede tener que hacer nada. La configuracin predeterminada para la deteccin de saltos de pgina es: / / * [Name () = 'H1' o el nombre de () = 'h2'] lo que significa es que calibre inserta saltos de pgina antes de cada <h1> y la etiqueta de <h2> por defecto. Nota: Las expresiones por defecto, pueden variar en funcin del formato de entrada que est convirtiendo.

Varios
Hay algunas opciones ms en esta seccin. Introduzca los metadatos como pgina de inicio en el libro Una de las mejores cosas de calibre es que le permite mantener los metadatos de forma muy completa sobre todos sus libros, por ejemplo, una clasificacin, etiquetas, comentarios, etc Esta opcin crear una pgina con todos estos metadatos y la inserta en el ebook convertido, normalmente justo despus de la cubierta. Piense en ello como una manera de crear su propio cubierta del libro personalizada.

Retire la primera imagen


A veces, el documento de origen que est convirtiendo la cubierta incluye como parte del libro, en lugar de como una cubierta separada. Si tambin se especifica una versin en calibre, a continuacin, convertir el libro tendr dos portadas. Esta opcin slo se eliminar la primera imagen del documento de origen, garantizando as que el libro convertido tiene una sola cubierta, la especificada en el calibre.

Tabla de contenidos
Cuando el documento de entrada tiene una tabla de contenido en sus metadatos, el calibre que slo se utilizan. Sin embargo, un nmero de otros formatos, o bien no son compatibles con una tabla de metadatos basado en de contenido, o documentos individuales no tienen una. En estos casos, las opciones de esta seccin puede ayudarle a generar automticamente una tabla de contenido en el ebook convertido, basado en el contenido real del documento de entrada. La primera opcin es el uso de la fuerza generada automticamente Tabla de Contenidos. Al marcar esta opcin usted puede tener calibre de anular cualquier Contenido que se encuentran en los metadatos del documento de entrada con el generado automticamente una. El modo por defecto que la creacin de la tabla de contenido generado automticamente funciona es que, calibre primero tratar de aadir captulos detectados en la tabla de contenidos generados. Usted puede aprender cmo personalizar la deteccin de los captulos en la seccin de deteccin de la estructura anterior. Si no desea incluir captulos detectados en la tabla de contenidos generados, active la casilla No aadir la opcin detectado captulos. Si es menor que el nmero mnimo captulo de los captulos se han detectado, el calibre luego aadir hipervnculos que encuentra en el documento de entrada a la tabla de contenido. A menudo, esto funciona bien muchos documentos de entrada incluyen una tabla de contenido con hipervnculos a la derecha en el comienzo. El nmero de enlaces opcin puede ser utilizado para controlar este comportamiento. Si se pone a cero, no se agregan enlaces. Si se establece en un nmero mayor que cero, a lo sumo que el nmero de enlaces se aade. Calibre filtrara automticamente los duplicados de la tabla de contenidos generados. Sin embargo, si hay algunas entradas adicionales indeseables, puede filtrar utilizando la opcin de filtro de TOC. Esta es una expresin regular que coincide con el ttulo de las entradas en la tabla de contenidos generados. Cuando se encuentra una coincidencia, se retira. Por ejemplo, para eliminar todas las entradas de los ttulos de "Siguiente" o "Anterior" uso:
Next|Previous

Finalmente, el nivel 1,2,3 TOC opciones le permiten crear un sofisticado multi-nivel Tabla de contenido. Son expresiones XPath que coincidan con

las etiquetas XHTML en el intermedio producido por el oleoducto de conversin. Consulte la Introduccin para la forma de obtener acceso a esta XHTML. Tambin puede leer el tutorial de XPath, para aprender a construir expresiones XPath. Al lado de cada opcin es un botn que lanza un asistente para ayudarle con la creacin de expresiones bsicas de XPath. El siguiente ejemplo ilustra cmo utilizar estas opciones. Suponga que tiene un documento de entrada que se traduce en XHTML que tener este aspecto:
html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>Sample document</title> </head> <body> <h1>Chapter 1</h1> ... <h2>Section 1.1</h2> ... <h2>Section 1.2</h2> ... <h1>Chapter 2</h1> ... <h2>Section 2.1</h2> ... </body> </html>

Luego, establezca las opciones:


Level 1 TOC : //h:h1 Level 2 TOC : //h:h2

Esto dar lugar a un cuadro de nivel genera automticamente dos de contenidos que se parecen a:
Chapter 1 Section 1.1 Section 1.2 Chapter 2 Section 2.1

Advertencia No todos los formatos de salida soportan una tabla de varios niveles de contenidos. En primer lugar, debe tratar con salida EPUB. Si eso funciona, a continuacin, intente el formato de su eleccin.

Uso de imgenes como ttulos de los captulos para convertir los documentos de entrada HTML
Suponga que usted desea utilizar una imagen como ttulo del captulo, pero todava quiere calibre para ser capaz de generar automticamente una tabla de contenido para que usted de los ttulos de los captulos. Utilice el siguiente cdigo HTML para lograr este
<html> <body> <h2>Chapter 1</h2> <p>chapter 1 text...</p> <h2 title="Chapter 2"><img src="chapter2.jpg" /></h2> <p>chapter 2 text...</p> </body> </html>

Establecer el nivel de un ajuste de TOC / / h: h2. Entonces, para el captulo dos, el calibre se llevar el ttulo a partir del valor del atributo title de la etiqueta <h2>, ya que la etiqueta no tiene texto.

Cmo se configuran las opciones / guardar para la Conversin


Hay dos lugares en los que las opciones de conversin se pueden establecer en el calibre. La primera es en Preferencias-> conversin. Estos valores son los valores predeterminados para las opciones de conversin. Cada vez que tratan de convertir a un nuevo libro, los ajustes establecidos aqu se utiliza por defecto. Tambin puede cambiar la configuracin en el cuadro de dilogo de conversin por cada conversin libro. Cuando se convierte un libro, calibre recuerda la configuracin que se utilizan para ese libro, de modo que si la convierte de nuevo, los ajustes guardados para el libro en particular, tendrn prioridad sobre los valores predeterminados en Preferencias. Puede restaurar los ajustes individuales a los valores predeterminados mediante el uso de la restauracin para el botn por defecto en el dilogo de libro de la conversin individual. Al por mayor Convertir un conjunto de libros, la configuracin se realizan en el siguiente orden:

A partir de los valores por defecto en Preferencias-> Conversin De la configuracin de conversin guardados para cada libro se est convirtiendo (si existe). Esto se puede desactivar la opcin en la esquina superior izquierda del cuadro de dilogo de conversin masiva. A partir de los ajustes establecidos en el cuadro de dilogo de conversin a granel Tenga en cuenta que la configuracin final de cada libro en una conversin masiva se guardar y volver a utilizar si el libro se convierte de nuevo. Desde la ms alta prioridad en la conversin al por mayor se da a los ajustes en el cuadro de dilogo de conversin a granel, stas tendrn prioridad sobre los ajustes de libros especficos. As que usted debe slo a granel convertir los libros juntos que necesita una configuracin similar. Las excepciones son los metadatos y la configuracin de formato de entrada especficos. Desde el cuadro de dilogo de conversin masiva no tiene la configuracin de estas dos categoras, que se tomar de datos de los libros especficos (si existe) o los valores predeterminados. Nota: Usted puede ver los valores reales utilizados durante cualquier conversin haciendo clic en el icono de girar en la esquina inferior derecha y haga doble clic en el trabajo de conversin individual. Con ello se abre un registro de conversin que contendr los valores reales que se utilizan, cerca de la parte superior.

Dar formato a consejos especficos


Aqu encontrar consejos especficos para la conversin de formatos particulares. Opciones especficas para formato en particular, ya sea de entrada o salida estn disponibles en el cuadro de dilogo de conversin bajo su propia seccin, por ejemplo TXT Input Output o EPUB. Convertir documentos de Microsoft Word calibre no convierte directamente archivos .doc / .docx de Microsoft Word. Sin embargo, en Word, puede guardar el documento como HTML y luego convertir el archivo HTML resultante con el calibre. Al guardar como HTML, asegrese de utilizar la opcin "Guardar como pgina Web, filtrado" opcin, ya que esto producir HTML limpio que se convertir as. Tenga en cuenta que la Palabra produce HTML muy sucio, la conversin puede tardar mucho tiempo, as que tenga paciencia. Otra alternativa es utilizar el OpenOffice libre. Abra el archivo. Doc en OpenOffice y guardarlo en formato de OpenOffice. Odt. calibre puede convertir directamente los archivos. odt. Hay un paquete de macro de Word que puede automatizar la conversin de

documentos de Word utilizando calibre. Tambin hace que la generacin de la tabla de contenido mucho ms simples. Se llama BookCreator y est disponible de forma gratuita en mobileread. Una manera fcil de generar una tabla de contenido al convertir un documento de Word es la siguiente: 1.Mark sus captulos y subcaptulos en el archivo doc con uno de los. MS estilos integrados llamado "Ttulo 1", "Ttulo 2", ..., 'Ttulo 6' "Ttulo 1" equivale a la <h1> etiqueta HTML, "Ttulo 2" a, etc <h2> 2.Guarde el doc como pgina web filtrada (en lugar de pgina web) e importar el archivo html en calibre 3.Cuando se convierte en el calibre que utiliza lo que hiciste en el paso 1 para fijar la caja llamada "Detectar los captulos en 'en el converso - pgina de la estructura de deteccin. Por ejemplo: Si marca con el estilo de los captulos "Ttulo 2" a continuacin, establecer los captulos en 'Detect' caja de / / h2 h: esto le dar un buen metadatos externos TOC en el epub convertido. Un ejemplo algo ms complejo ... si el libro tiene secciones y captulos y se desea una tabla de contenido anidado de 2 niveles de metadatos. Marcar las secciones de documentacin con el estilo "Ttulo 2 'y los captulos con estilo" Ttulo 3 ". Cuando se convierte establecer los captulos en 'Detect' caja de / / h: h2 | / / h: h3. En el Convert - pgina TOC establecer el "nivel 1 TOC" caja de / / h: H2 y el cuadro de Nivel 2 TOC 'a / / h: h3. Convertir documentos TXT Documentos TXT no tienen forma bien definida para especificar el formato como negrita, cursiva, etc, o la estructura del documento, como prrafos, ttulos, secciones y as sucesivamente, pero hay una variedad de convenios de uso comn. Por defecto intenta calibre de la deteccin automtica del formato correcto y marcado sobre la base de esos convenios. De entrada TXT es compatible con una serie de opciones para diferenciar cmo se detectan los prrafos. Estilo de prrafo: Auto Analiza el archivo de texto y trata de determinar automticamente qu prrafos se definen. Esta opcin por lo general funciona bien, si usted obtener resultados no deseados probar una de las opciones manuales. Estilo de prrafo: Bloque Asume una o ms lneas en blanco son una frontera de prrafo:
This is the first. This is the

second paragraph.

Estilo de prrafo: Simple Se supone que cada lnea es un prrafo:


This is the first. This is the second. This is the third.

Estilo de prrafo: Imprimir Se supone que cada prrafo comienza con un guin (ya sea un tabulador o 2 plazas +). Prrafos terminar cuando la siguiente lnea que comienza con un guin que se lleg:
This is the first. This is the second. This is the third.

Estilo de prrafo: sin formato Se supone que el documento no tiene formato, pero no utiliza saltos de lnea. La puntuacin y la longitud de la lnea media se utilizan para tratar de volver a crear prrafos. Estilo de formato: Auto Attemtps para detectar el tipo de marcado de formato que se utiliza. Si no marcado se utiliza entonces el formato heurstico ser aplicado. Estilo de formato: Heurstica Analiza el documento de ttulos de los captulos comunes, saltos de escena, y las palabras en cursiva y aplica el cdigo HTML apropiado durante la conversin. Estilo de formato: Markdown calibre tambin se admite la ejecucin de entrada TXT a travs de un preprocesador de transformacin conocido como rebaja. Markdown permite el formato bsico que se aadirn a los documentos TXT, como negrita, cursiva, ttulos de las secciones, tablas, listas, una tabla de contenidos, etc Marcar ttulos de los captulos con una de las principales # y el establecimiento de la expresin XPath de deteccin para el captulo "/ / h: h1 "es la forma ms fcil de tener una tabla adecuada de los contenidos generados a partir de un documento TXT. Usted puede aprender ms acerca de la sintaxis Markdown en daringfireball. Estilo de formato: Ninguno No se aplica un formato especial al texto, el documento se convierte en html sin ningn otro cambio.

Convertir documentos PDF


Los documentos PDF son uno de los peores formatos para convertir. Se trata de un tamao fijo de pgina y el formato de la colocacin del texto. Sentido, es muy difcil determinar dnde termina una y empieza otro prrafo. Calibre a tratar de desenvolver los prrafos utilizando un configurable, Un factor de ajuste de lnea. Esta es una escala utilizada para determinar la longitud a la cual debe ser una lnea sin envolver. Los valores vlidos son un decimal entre 0 y 1. El valor predeterminado es de 0,45, justo debajo de la longitud de la lnea mediana. Baje este valor para incluir ms texto en el desembalaje. Aumento de incluir menos. Usted puede ajustar este valor en la configuracin de conversin de entrada en formato PDF. Adems, a menudo tienen los encabezados y pies como parte del documento que se convertir incluido en el texto. Utilice la bsqueda y reemplazo del panel para eliminar los encabezados y pies de pgina para mitigar este problema. Si los encabezados y pies de pgina no se eliminan del texto que pueden romper el desembalaje prrafo. Para aprender a utilizar el encabezado y pie de pgina las opciones de eliminacin, lea sobre el uso de expresiones regulares en el calibre. Algunas de las limitaciones de PDF de entrada son los siguientes: Los documentos complejos, con varias columnas, y de imagen basado en que no son compatibles. Extraccin de imgenes vectoriales y mesas de dentro del documento tampoco es compatible. Algunos archivos PDF utilizan glifos especiales para representar ll o FF o msica, etc conversin de stos pueden o no funcionar dependiendo de cmo se representan internamente en el formato PDF. Algunos archivos PDF almacenar sus imgenes al revs con una instruccin de la rotacin, el calibre no admite actualmente que la instruccin, por lo que las imgenes se rotarn en la salida tambin. Los vnculos y tablas de contenido no son compatibles PDF incrustados que utilizan fuentes no unicode para representar caracteres no ingleses permite la salida distorsionada de los personajes Algunos archivos PDF se compone de fotografas de la pgina con el texto OCRed detrs de ellos. En tales casos, calibre utiliza el texto OCRed, que puede ser muy diferente de lo que se ve al abrir el fichero PDF Para reiterar PDF es un formato muy, muy mal a utilizar como entrada. Si

es absolutamente necesario utilizar PDF, entonces estar preparado para una salida que puede ir desde decente inservible, dependiendo del formato PDF de entrada.

Colecciones Comic Book


Una coleccin de cmics es un archivo. CBC. Un archivo. CBC es un archivo zip que contiene otros CBZ / CBR archivos. Adems, el archivo. CBC debe contener un archivo de texto simple llamado comics.txt, codificado en UTF-8. El archivo comics.txt debe contener una lista de los archivos de cmic en el interior del archivo CBC, en el nombre del archivo siguiente forma:. Ttulo, como se muestra a continuacin:
one.cbz:Chapter One two.cbz:Chapter Two three.cbz:Chapter Three

El archivo de CBC. a continuacin, deber contener:


comics.txt one.cbz two.cbz three.cbz

Calibre convertir automticamente este archivo. CBC en un libro electrnico con una tabla de contenidos que apuntan a cada entrada en comics.txt.

Demostracin EPUB formato avanzado


Varios formato avanzado para archivos EPUB se demuestra en este archivo de demostracin. El archivo fue creado de la mano de cdigo HTML con el calibre y est destinado a ser utilizado como una plantilla para sus propios esfuerzos de creacin de EPUB. El cdigo fuente HTML que fue creado a partir de es demo.zip disponible. Los parmetros utilizados para crear el EPUB desde el archivo ZIP son los siguientes:
ebook-convert demo.zip .epub -vv --authors "Kovid Goyal" --language en --

Tenga en cuenta que debido a este archivo explora el potencial de EPUB, la mayor parte del formato avanzado no va a trabajar en los lectores menos capaces que visor de calibre de EPUB.

Todo sobre el uso de expresiones regulares en el calibre


Las expresiones regulares son funciones que se utilizan en muchos lugares en Calibre para llevar a cabo una manipulacin sofisticada de los contenidos de libros electrnicos y los metadatos. Este tutorial es una introduccin suave para conseguir que se inicie en el uso de expresiones regulares en Calibre.

Contenido
En primer lugar, una palabra de advertencia y una palabra de aliento En qu calibre puede utilizar expresiones regulares? Qu diablos es una expresin regular? Atencin a explicar? Eso no suena tan mal. Qu sigue? Oye, bonita! Esto est empezando a tener sentido! Bueno, estos caracteres especiales son muy limpio y todo, pero lo que si yo quera para que coincida con un punto o un signo de interrogacin? Entonces, qu son los conjuntos ms tiles? Pero si tuviera unos cuantos hilos diferentes que quera a la altura, las cosas se complican? Te has perdido ... En el principio, usted dijo que no haba una manera de hacer un caso de expresiones regulares insensibles? Creo que estoy empezando a entender estas expresiones regulares ahora ... cmo puedo utilizarlas en calibre? Las Conversiones Aadir libros edicin de metadatos a granel Crditos

En primer lugar, una palabra de advertencia y una palabra de aliento


Esto es, inevitablemente, va a ser algo tcnico, despus de todo, las expresiones regulares son una herramienta tcnica para hacer cosas tcnicas. Voy a tener que usar la jerga y los conceptos que pueden parecer complicados o enrevesados. Voy a tratar de explicar esos conceptos tan claramente como pueda, pero en realidad no se puede hacer sin utilizarlos. Dicho esto, no se desanime por la jerga, como he tratado de explicar todo es nuevo. Y mientras que las expresiones regulares se puede parecer una magia arcana, negra (o, para ser ms prosaica, una cadena aleatoria de galimatas de letras y signos), les prometo que no son para nada

complicadas. Incluso aquellos que entienden muy bien las expresiones regulares tienen problemas para leer las ms complejos, pero escribirlas no es tan difcil. Se construye paso a paso la expresin. Por lo tanto, dar un paso y que me siga en la madriguera del conejo.

En qu calibre puede utilizar expresiones regulares?


Hay unos pocos lugares donde calibre utiliza expresiones regulares. Ah est el Buscar y reemplazar en las opciones de conversin, deteccin de metadatos a partir de nombres de archivo en la configuracin de importacin y Buscar y reemplazar al editar los metadatos de los libros a granel.

Qu diablos es una expresin regular?


Una expresin regular es una manera de describir conjuntos de cadenas. Un sola expresin regular que coincida con un nmero de cadenas diferentes. Esto es lo que hace tan poderosa expresin regular - que son una manera concisa de describir un nmero potencialmente elevado de variaciones. Nota: Estoy usando un cordn aqu en el sentido que se usa en los lenguajes de programacin: una cadena de uno o ms caracteres, personajes como personajes reales, nmeros, signos de puntuacin y los llamados espacios en blanco (los saltos de lnea, tabuladores, etc.) Tenga en cuenta que, en general, los caracteres en maysculas y minsculas no se consideran de la misma forma, por lo tanto "a". es un personaje diferente de "A" y as sucesivamente. En calibre, las expresiones regulares son maysculas y minsculas en la barra de bsqueda, pero no en las opciones de conversin. Hay una manera de hacer que todos los casos la expresin regular insensible, pero vamos a hablar de eso ms tarde. No se complica porque las expresiones regulares permiten variaciones en las secuencias que coincidan, por lo que una expresin puede coincidir con varias cadenas, por lo que no se moleste por ello. Ms sobre esto en un momento.

Cuidado de explicar?
Bueno, por eso estamos aqu. En primer lugar, este es el concepto ms importante en las expresiones regulares: una cadena de por s es una expresin regular que coincide consigo misma. Es decir, si yo quera para que coincida con la cadena "Hola, Mundo!" utilizando una expresin regular, la expresin regular a utilizar sera Hola, Mundo!. Y s, es as de simple. Se dar cuenta, sin embargo, que esto slo coincide con la cadena exacta "Hola, Mundo!", Por ejemplo, no "Hola, mundo!" o "hola, mundo!"

o cualquier variacin de este tipo.

Eso no suena tan mal. Qu sigue?


El siguiente es el comienzo de las cosas realmente buenas. Recuerde que dije que las expresiones regulares puede coincidir con varias cadenas? Aqu es donde se pone un poco ms complicado. Digamos, como un ejercicio un poco ms prctico, el libro que quera convertir tena un pie de pgina desagradable que contaba las pginas, como "Pgina 5 de 423". Obviamente, el nmero de pgina aumenta de 1 a 423, por lo tanto tendra que coincidir con 423 cadenas diferentes, verdad? Mal, en realidad: las expresiones regulares permiten definir conjuntos de caracteres que coinciden: Para definir un conjunto, poner todos los caracteres que desea estar en el conjunto entre corchetes. As, por ejemplo, el conjunto [abc] sera coincidir con el carcter "a", "b" o "c". Juegos de siempre slo coincide con uno de los personajes de la serie. Ellos "entienden" los rangos de caracteres, es decir, si usted quiere para que coincida con todos los caracteres en minsculas, tendr que utilizar el conjunto [az] para los personajes menores-y en maysculas que utilizara [a-zA-Z] y as sucesivamente . Entiendes la idea? As que, obviamente, utilizando la pgina de la expresin [0-9] de 423 que sera capaz de igualar las primeras 9 pginas, reduciendo as las expresiones necesarias para tres: La pgina de la segunda expresin [0-9] [0-9] de 423 se correspondera con todos los nmeros de pgina de dos dgitos, y estoy seguro de que usted puede adivinar lo que la tercera expresin se vera as. S, adelante. Antelo. Oye, bonito! Esto est empezando a tener sentido! Esperaba que dijeras eso. Pero preprate, ahora se pone an mejor! Acabamos de ver que el uso de conjuntos, que podra coincidir con uno de los personajes a la vez. Pero incluso se puede repetir un carcter o conjunto, la reduccin del nmero de las expresiones necesarias para manejar el ejemplo el nmero de pgina por encima de a uno. S, uno! Emocionado? Debe estarlo! Trabaja como esto: "?" Algunos llamados caracteres especiales, "+" y "*", repetir el nico elemento que los precede. (Elemento significa tanto un solo carcter, un conjunto de caracteres, una secuencia de escape o un grupo (vamos a aprender acerca de los dos ltimos ms adelante) -. En una palabra, una sola entidad en una expresin regular. Estos personajes son llamados comodines o cuantificadores. Para ser ms precisos, "?" Coincide con 0 o 1 del elemento anterior, "*" coincide con 0 o ms del elemento anterior y "+" con 1 o ms del elemento anterior. Unos pocos ejemplos: la expresin una? le corresponde a ninguno "" (que es la cadena vaca, no es estrictamente til en este caso) o "a", la expresin a * se ajusta a "", "A", "AA" o cualquier nmero de una en una fila, y Por

ltimo, la expresin a + coincidira con "a", "AA" o cualquier nmero de una en una fila (Nota: no se correspondera con la cadena vaca!). Lo mismo pasa para los conjuntos: La expresin [0-9] + coincidira con cada nmero entero que hay! S lo que ests pensando, y tienes razn: si el uso que en el caso anterior de los nmeros de pgina correspondientes, no ser la nica que una expresin para que coincida con todos los nmeros de pgina? S, la pgina de la expresin [0-9] + de 423 coincidira con cada nmero de pgina en ese libro! Nota: Una nota sobre estos cuantificadores: Por lo general, tratar de coincidir con el texto tanto como sea posible, as que ten cuidado al utilizarlos. Esto se llama "el comportamiento codicioso" - estoy seguro de que entiendo por qu. Se vuelve un problema cuando, por ejemplo, tratar de coincidir con una etiqueta. Consideremos, por ejemplo, la cadena "<p class="calibre2"> ttulo aqu </ p>", y digamos que te gustara para que coincida con la etiqueta de apertura (la parte entre el primer par de parntesis angulares, un poco ms en etiquetas ms adelante). Se podra pensar que la expresin de <p.*> coincidira con esa etiqueta, pero en realidad, coincide con la cadena entera! (El carcter "." Es otra de carcter especial. Coincide con cualquier cosa excepto los saltos de lnea, por lo que, bsicamente, la expresin. * Se ajusta a una sola lnea que se pueda imaginar.) En su lugar, trate de usar <p.*?> lo que hace que el cuantificador "*" no voraz. Esa expresin slo coincide con la primera etiqueta de apertura, segn lo previsto. De hecho, hay otra manera de lograr esto: la expresin <p[^>] *> coincidir con la misma abertura de etiqueta vers por qu despus en la siguiente seccin. Slo tenga en cuenta que hay, con bastante frecuencia, ms de una manera de escribir una expresin regular.

Pues bien, estos caracteres especiales son muy limpios y todo, pero lo que yo quera es que coincida con un punto o un signo de interrogacin?
Por supuesto, puedes hacer lo siguiente: Slo hay que poner una barra invertida delante de cualquier carcter especial y se interpreta como un carcter literal, sin ningn significado especial. Este par de una barra invertida seguida por un solo personaje que se llama una secuencia de escape, y el acto de poner una barra invertida delante de un carcter especial que se llama escapar de ese personaje. Una secuencia de escape se interpreta como un solo elemento. Hay, por supuesto, secuencias de escape para hacer algo ms que escapar los caracteres especiales, por ejemplo, "\ t", un tabulador. Vamos a llegar a algunas de las secuencias de escape ms tarde. Ah, y dicho sea de paso, en relacin con los caracteres especiales:

Considere la posibilidad de cualquier carcter que discutimos en esta introduccin que tienen alguna funcin de ser especial y por lo tanto necesita ser escapado si desea que el carcter sea literal.

Entonces, Cuales son los conjuntos ms tiles?


Saba que lo ibas a preguntar. Algunos conjuntos de tiles son [0-9] coincide con un nmero nico, [az] coincide con un sola letra en minscula, [AZ] coincide con un letra mayscula, [a-zA-Z] juego una sola letra y [a-zA-Z0 -9] juego de una sola letra o un nmero. Tambin puede utilizar una secuencia de escape como forma abreviada: \ D es equivalente a [0-9] \ W es equivalente a [a-zA-Z0-9_] \ S es equivalente a cualquier whitespaceNote: "Los espacios en blanco" es un trmino para cualquier cosa que no se imprimir. Estos personajes incluyen el espacio, tabulador, avance de lnea, salto de pgina y el retorno de carro. Como una ltima nota sobre los conjuntos, tambin se puede definir un conjunto como cualquier personaje, sino las del conjunto. Usted hace que al incluir el carcter "^" como el primer personaje en la serie. Por lo tanto, [^ a] que coincide con cualquier carcter excepto "a". Eso se llama completando el conjunto. Esas abreviaturas de secuencias de escape que vimos anteriormente tambin se puede complementar: "\ D" significa cualquier carcter no numeral, lo cual es equivalente a [^ 0-9]. Las abreviaturas de otros puede ser complementada por, lo has adivinado, con la letra correspondiente en mayscula en lugar de la minscula uno. As que, volviendo al ejemplo <p[^>] *> de la seccin anterior, ahora se puede ver que el conjunto de caracteres que est utilizando intenta hacer coincidir cualquier carcter salvo un parntesis angular de cierre.

Pero si tuviera unos cuantos hilos diferentes que quera a la altura, las cosas se complican?
El miedo no, la vida sigue siendo buena y fcil. Considere este ejemplo: El libro que va a convertir tiene "ttulo", escrito en cada pgina impar y "Autor", escrito en cada pgina par. Luce muy bien en la impresin, verdad? Sin embargo, en libros electrnicos, es molesto. Puede agrupar las expresiones enteras entre parntesis normales, y el carcter "|" le permitir coincidir con la expresin situada a la derecha o la que a su izquierda. Combinar esos y ya est. Demasiado rpido para usted? Bueno, primero que nada, se agrupan las expresiones para pginas pares e impares,

obteniendo as (Ttulo) (Autor) como las dos expresiones necesarias. Ahora hacemos las cosas ms simples mediante el uso de la barra vertical ("|" se llama el carcter de barra vertical): Si se utiliza la expresin (Ttulo | Autor) ya sea que usted consigue el de "Ttulo" (en las pginas impares) o que te coincida con "autor" (en las pginas pares). Bueno, no era tan fcil? Puede, por supuesto, usar la barra vertical, sin el uso de parntesis de agrupamiento, tambin. Recuerdas cuando dije que los cuantificadores repiten el elemento que precede? Bueno, la barra vertical funciona un poco diferente: La expresin "Ttulo | Autor" tambin corresponde a ninguno de la cadena "Ttulo" o la cadena "Autor", al igual que el ejemplo anterior, mediante la agrupacin. La barra vertical permite elegir entre toda la expresin anterior y posterior a ella. As que, si queran igualar las cadenas "Calibre" y "calibre" y quiso elegir slo entre maysculas y minsculas "c", que tendra que utilizar la expresin (C | C) Alibre, donde la agrupacin asegura que slo la "c" ser seleccionado. Si usted fuera a utilizar c | Calibre, se obtendra un partido en la cadena "c" o en la cadena "Calibre", que no es lo que queramos. En resumen: En caso de duda, utilice la agrupacin junto con la barra vertical.

Te perdiste ...
... Espera un minuto, hay una ltima cosa, realmente buena que puedes hacer con los grupos. Si usted tiene un grupo que previamente emparejado, puede utilizar las referencias a ese grupo ms adelante en la expresin: Los grupos se numeran empezando por 1, y se les escapa de referencia por el nmero del grupo que desea hacer referencia, por lo tanto, el quinto grupo se hace referencia como \ 5. Por lo tanto, si usted busca ([^] +) \ 1 en el "Test de prueba" de cadena, que te coincida con la cadena entera!

En el principio, usted dijo que no haba una manera de hacer un caso de expresiones regulares insensibles?
S, lo hice, gracias por prestar atento y recordar. Se puede decir que calibre desea que ciertas cosas sean manejadas mediante las llamadas banderas. Se incluyen las banderas de su expresin mediante la construccin especial (? Banderas ir aqu), donde, obviamente, que te sustituya "banderas ir aqu" con las banderas especficas que desee. Para ignorar el caso, el indicador i es, por lo que se incluye (i) en su expresin. Por lo tanto, la prueba (? I) se correspondera con "Test", "test", "Test" y cualquier variacin caso de que usted podra pensar. Otro indicador til permite que el punto coincida con cualquier carcter en

absoluto, incluyendo la nueva lnea, el indicador s. Si desea utilizar varios indicadores en una expresin, acaba de poner en la misma declaracin: pasara por alto el caso y hacer que el punto de coincidir con todos (es?). No importa que bandera que primer estado, (? SI) sera equivalente a la anterior. Por cierto, buenos lugares para poner banderas en su expresin sera ni el principio ni el final. De esa manera, no se confundan con otra cosa.

Creo que estoy empezando a entender estas expresiones regulares ahora ... cmo puedo utilizarlos en calibre? Conversiones
Vamos a comenzar con la configuracin de conversin, que es realmente buena. En la parte de bsqueda y reemplazo, puede introducir una expresin regular (la abreviatura de la expresin regular) que describe la cadena que va a ser sustituido durante la conversin. La parte interesante es el asistente. Haga clic en el personal asistente y se obtiene una vista previa de lo qu calibre "ve" durante el proceso de conversin. Desplcese hacia abajo en la cadena que desea eliminar, seleccione y copie, pguelo en el campo de expresin regular en la parte superior de la ventana. Si hay partes variables, como los nmeros de pgina o algo as, utilice conjuntos y cuantificadores para cubrir aquellos, y mientras esta en ello, acurdese de escapar los caracteres especiales, si hay algunos. Pulse el botn con la etiqueta de prueba y calibre se destacan las piezas que se reemplazan son el uso de la expresin regular. Una vez que est satisfecho, pulse Aceptar y convertir. Tenga cuidado si el origen de la conversin tiene etiquetas como este ejemplo: Tal vez, pero los policas se sienten igual que usted, Anita. Qu es un vampiro ms muertos? Las nuevas leyes no cambian. </ P> <p class="calibre4"> <b class="calibre2"> Generado por ABC Amber LIT Conv <a href="http://www.processtext.com/abclit.html" class="calibre3"> erter, http://www.processtext.com/abclit.html </ a> </ b> </ p> <p class="calibre4"> slo haba estado dos aos desde que Addison contra Clark. El caso de la corte nos dio una versin revisada de cmo era la vida (sin vergenza arrancado de este hilo). Habra que eliminar algunas de las etiquetas tambin. En este ejemplo, me gustara recomendar a partir de la etiqueta de class="calibre2"> <b, ahora tienes que terminar con la correspondiente etiqueta de cierre (las etiquetas de apertura son <tag>,

etiquetas de cierre son </ tag>), que es simplemente el siguiente </ b> en este caso. (Consulte el manual de HTML bien o pregunte en el foro si no tiene claro este punto.) La etiqueta de apertura puede ser descrito con <b.*? >, utilizando la etiqueta de cierre </ b>, con lo que se podra eliminar todo lo que entre las etiquetas con <b.*?>. * </ b>. Pero el uso de esta expresin sera una mala idea, ya que elimina todo lo encerrado por <b> - etiquetas (que, dicho sea de paso, hacer que el texto encerrado en negrita), y es una apuesta segura decir que vamos a eliminar partes de la libro de esta manera. En su lugar, incluir el principio de la cadena cerrada y, por lo que la expresin regular <b.*?> \ s * Generado \ s + por \ s + ABC \ s + Amber \ s + LIT. * </ B> El \ s con cuantificadores se incluyen aqu en vez de forma explcita utilizando los espacios como se ve en la cadena para capturar las variaciones de la cadena que podra ocurrir. Recuerde revisar qu calibre se retire para asegurarse de que no retire las porciones que desea conservar, si se prueba una nueva expresin. Si slo marque una ocurrencia, es posible que se pierda un desajuste en alguna parte del texto. Tambin tenga en cuenta que en caso de que accidentalmente eliminar etiquetas ms o menos de lo que realmente quera, calibre intenta reparar el cdigo daado despus de hacer el traslado.

Adicin de libros
Otra cosa que usted puede utilizar expresiones regulares para es extraer metadatos de los nombres de archivo. Usted puede encontrar esta caracterstica en el "Aadir libros" parte de la configuracin. Hay una caracterstica especial: (? P <title>) Puede utilizar nombres de campo para los campos de metadatos, por ejemplo, indica que el calibre utiliza esta parte de la cadena como ttulo del libro. Los nombres de los campos permitidos se enumeran en las ventanas, junto con otra prueba de campo agradable. Un ejemplo: Digamos que usted desea importar un montn de archivos con el nombre como los textos clsicos: La Divina Comedia de Dante Alighieri.mobi. (Obviamente, esto ya est en su biblioteca, ya que a todos nos gusta la poesa clsica italiana) o la pica de ciencia ficcin: La Triloga de la Fundacin de Isaac Asimov.epub. Esto es obviamente un esquema de nombres que calibre no va a extraer datos significativos de - su expresin estndar para la extraccin de metadatos es (P + <title>?.) - (P <author> [^ _] +?). Una expresin regular que trabaja aqu sera [a-zA-Z] +: (?. P <title> +) por (?. <author> P +). Por favor, tenga en cuenta que, dentro del grupo para el campo de los metadatos, es necesario utilizar expresiones para describir lo que realmente coincide con el campo. Y tambin en cuenta que, cuando se utiliza el calibre de prueba de campo ofrece, es necesario agregar la extensin del archivo a su nombre la prueba, de lo contrario no obtendr ningn partido en absoluto, a pesar de utilizar

una expresin de trabajo.

Edicin de metadatos a granel


La ltima parte es la bsqueda de expresiones regulares y reemplazar en los campos de metadatos. Puede acceder a este mediante la seleccin de varios libros en la biblioteca y el uso de edicin masiva de metadatos. Tenga mucho cuidado al utilizar esta ltima caracterstica, ya que puede hacer cosas muy malas a la biblioteca! Doublecheck que sus expresiones hagan lo que ellos quieren usar los campos de prueba, y slo marcar los libros que realmente quieren cambiar! En el modo de expresin de bsqueda normal, usted puede buscar en un campo, reemplazar el texto con algo e incluso escribir el resultado en otro campo. Un ejemplo prctico: Supongamos que su biblioteca contena los libros de la serie Dune de Frank Herbert, nombrados despus de la duna de la moda 1 - Dune, Dune 2 - Dune Mesas y as sucesivamente. Ahora usted quiere conseguir Duna en el campo de la serie. Puede hacerlo mediante la bsqueda de \ d + (*.?) -. * En el campo de ttulo y su sustitucin por \ 1 en el campo de serie. Mira lo que hice all? Eso es una referencia al primer grupo que est reemplazando el campo de serie con. Ahora que tiene la serie todo listo, slo tienes que hacer otra bsqueda. *? - En el campo de ttulo y sustituirlo por "" (una cadena vaca), de nuevo en el campo de ttulo y los metadatos es todo limpio y ordenado. No es genial? Por cierto, en lugar de reemplazar todo el campo, tambin puede agregar o anteponer al campo, por lo que, si quera que el ttulo del libro que se antepone con la informacin de la serie, se puede hacer eso tambin. A medida que por ahora han notado, sin duda, hay una casilla etiquetada en maysculas y minsculas, por lo que no tendr que utilizar las banderas para seleccionar el comportamiento de aqu. Bueno, que casi llega a la conclusin de la muy breve introduccin a las expresiones regulares. Espero que me han demostrado lo suficiente como para al menos empezar y para que pueda seguir aprendiendo por s mismo, un buen punto de partida sera la documentacin de Python para expresiones regulares. Una ltima palabra de advertencia: Expresiones regulares son poderosos, pero tambin es muy fcil equivocarse. Calibre ofrece posibilidades de pruebas muy grandes para ver si sus expresiones se comportan como usted espera que ellos. salos. Trate de no disparar en el pie. (Dios, me encanta esa expresin ...) Pero en caso de que, a pesar de la advertencia, lesiones en el pie (o cualquier otra parte del cuerpo), tratar de aprender de ella.

You might also like