E-bokskonvertering

calibre har ett konverteringssystem som är utdataformat för att vara mycket lätt att använda. Normalt du bara lägger till en bok till calibre, klicka konvertera och calibre kommer att försöka intensivt för att generera utdata som är så nära som möjligt till ingången. Däremot accepterar calibre ett mycket stort antal indataformat, inte alla som är så lämpliga som andra för konvertering till e-böcker. I fråga om sådana inmatningsformat, eller om du bara vill ha större kontroll över konverteringssystemet, har calibre en hel del alternativ för att finjustera konverteringen. Observera dock att calibre konverteringssystem inte är en ersättning för en fullständig e-bokredigerare. Om du vill redigera e-böcker, rekommenderar jag att du först konverterar dem till EPUB eller AZW3 med calibre och sedan använder Redigera bok-funktionen för att få dem i perfekt form. Du kan sedan använda den redigerade e-boken som indata för konvertering till andra format i calibre.

Detta dokument kommer avser främst konverteringsinställningarna som finns i dialogrutan konverteringen, bilden nedan. Alla dessa inställningar är även tillgängliga via kommandoraden för konvertering, dokumenterat på ebook-convert. I calibre, kan du få hjälp av någon enskild inställning genom att hålla musen över det, då kommer ett verktygstips visas som beskriver inställningen.

E-book conversion dialog

Introduktion

Det första man måste förstå om konverteringssystemet är att det är utdataformat som en rörledning. Schematiskt ser det ut så här:

The conversion pipeline

Inmatningsformatet konverteras först till XHTML med lämplig Indatainsticksmodul. Denna HTML omvandlas sedan. I det sista steget, är den bearbetade XHTML konverterad till det angivna utdataformat med lämplig Utdatainsticksmodul. Resultaten av konverteringen kan variera kraftigt, beroende på inmatningsformatet. Vissa format konverteras mycket bättre än andra. En lista med de bästa källformaten för konvertering finns här.

Omvandlingar som verkar på XHTML-utdata är där allt arbete sker. Det finns olika omvandlingar, till exempel för att sätta in bokens metadata som en sida i början av boken, för att upptäcka kapitelrubriker och automatiskt skapa en innehållsförteckning, att proportionellt justera teckenstorlekar och så vidare. Det är viktigt att minnas att alla omvandlingar verkar på XHTML-utdata av Indatainsticksmodulen, inte på indatafilen. Så, till exempel, om du ber calibre att konvertera en RTF-fil till EPUB, kommer den först konverteras till XHTML internt, de olika omvandlingarna kommer att tillämpas på XHTML och sedan kommer Utdatainsticksmodulen att skapa EPUB-filen, automatiskt skapa all metadata, innehållsförteckning, och så vidare.

Du kan se denna process i handling genom att använda felsökningsalternativet Debug icon. Bara ange sökvägen till en katalog för felsökningsutdata. Under konverteringen kommer calibre att placera XHTML-genererade av de olika stegen av konverteringen i olika underkataloger. De fyra underkataloger är:

Skeden av konverteringen
Katalog Beskrivning
indata Den innehåller HTML-utdata från Indatainsticksmodulen. Använd detta för att felsöka Indatainsticksmodulen.
analyserad Resultatet av förbehandling och konvertering till XHTML-utdata från indatainsticksmodulen. Används för att felsöka strukturdetektering.
struktur Efterstrukturell detektering, men innan CSS-utplattning och teckenstorlekskonvertering. Används för att felsöka teckenstorlekskonvertering och CSS-omvandlingar.
bearbetad Precis innan e-boken passerar till Utdatainsticksmodulen. Används för att felsöka Utdatainsticksmodulen.

Om du vill redigera indatadokumentet lite innan calibre konverterar det, är det bästa att göra redigera filerna i indata underkatalog och sedan packa upp och använda ZIP-filen som indataformat för efterföljande konverteringar. För att göra detta använder Edit meta information dialogrutan för att lägga ZIP-filen som ett format för boken och sedan, i det övre vänstra hörnet i konverteringsdialogrutan väljer ZIP som indataformat.

Detta dokument kommer att främst ta itu med de olika omvandlingar som verkar på mellan XHTML och hur man kan anpassa dem. I slutet är några tips som är specifika för varje indata- och utdataformat.

Utseende & känsla

Denna grupp av alternativ anpassar olika aspekter av utseendet och känslan av den konverterade e-boken.

Typsnitt

En av de trevligaste inslagen i e-läsupplevelse är möjligheten att enkelt justera teckenstorlek för att passa individuella behov och ljusförhållanden. calibre har sofistikerade algoritmer för att säkerställa att alla böcker det avger har konsistenta teckenstorlekar, oavsett vilken teckenstorlekar anges i indatadokumentet.

Teckengrundstorlek på ett dokument är den vanligaste teckenstorleken i detta dokument, det vill säga storleken på den största delen av texten i dokumentet. När du anger en Basteckenstorlek, skalar calibre automatiskt alla teckenstorlekar i dokumentet proportionellt, så att den vanligaste teckenstorleken blir den angivna basstorleken och andra teckenstorlekar skalas på lämpligt sätt. Genom att välja en större basstorlek, kan du göra typsnitten i dokumentet större och vice versa. När du ställer in basstorleken, för bästa resultat, bör du också ställa in teckenstorleken.

Normalt kommer calibre automatiskt att välja en teckengrundstorlek lämplig för utdataprofil som du har valt (se Sidinställning ). Du kan dock åsidosätta detta här ifall standarden inte är lämplig för dig.

Teckenstorleksnycklar alternativet kan du anpassa hur icke-teckengrundstorlekar skalas. Typsnittetets omskalningsalgoritm fungerar med hjälp av en teckenstorleksnyckel, vilket helt enkelt är en kommaseparerad lista med teckenstorlekar. Teckenstorleksnyckel anger för calibre hur många ”steg” större eller mindre en given teckenstorlek bör jämföras med basstorleken. Tanken är att det ska finnas ett begränsat antal teckenstorlekar i ett dokument. Till exempel, en storlek för huvudtext, ett par storlekar för olika nivåer av rubriker och ett par storlekar för upphöjd/nersänkt typsnitt och fotnoter. Teckenstorleksnyckel tillåter calibre att dela upp de teckenstorlekar i inmatningsdokumenten i separata ”fack” som motsvarar de olika logiska teckenstorlekarna.

Låt oss illustrera med ett exempel. Antag att källdokumentet vi konverterar producerades av någon med utmärkt syn och har en teckengrundstorlek på 8 punkter. Det innebär att huvuddelen av texten i dokumentet är dimensionerad för 8 punkter, medan rubriker är något större (säg 10 och 12 punkter) och fotnoter något mindre på 6 punkter. Nu om vi använder följande inställningar:

Base font size : 12pt
Font size key  : 7, 8, 10, 12, 14, 16, 18, 20

Utdatadokumentet kommer att ha en teckengrundstorlek på 12 punkter, rubrikerna 14 och 16 punkter och fotnoter 8 punkter. Antag nu vi vill göra att den största rubriken storleken sticker ut mer och göra fotnoter lite större också. För att uppnå detta bör det typsnittsnyckel ändras till:

New font size key : 7, 9, 12, 14, 18, 20, 22

De största rubrikerna blir nu 18 punkter, medan sidnoter blir 9 punkter. Du kan spela med dessa inställningar för att försöka lista ut vad som skulle vara optimalt för dig med hjälp av tecken omskalningsguiden som kan nås genom att klicka på den lilla knappen bredvid Teckenstorleksnyckel.

Alla omskalningar av teckenstorleken i konverteringen kan även stängas av här, om du vill bevara teckenstorlekar i inmatningsdokumentet.

En relaterad inställning är Radhöjd. Radhöjd styr den vertikala höjden på rader. Som standard (ett radavstånd av 0) utförs ingen manipulation av linjehöjder. Om du anger ett icke-standardvärde, kommer linjehöjder sättas på alla platser som inte anger sina egna linjehöjder. Detta är dock något av en trubbigt vapen och bör användas sparsamt. Om du vill justera linjehöjder för vissa avsnitt av indata, är det bättre att använda Extra-CSS.

I det här avsnittet kan du också berätta för calibre att bädda in några refererade typsnitt i boken. Detta gör det möjligt för typsnitten att fungera på läsarenheter, även om de inte är tillgängliga på enheten.

Text

Text kan antingen justeras eller inte. Justerad text har extra mellanslag mellan ord för att ge en jämn högermarginal. Vissa människor föredrar justerad text, andra gör det inte. Normalt kommer calibre bevara justeringen i originaldokuemtet. Om du vill åsidosätta det kan du använda alternativet guilabel:Textjustering i det här avsnittet.

Du kan också be calibre att Förbättra interpunktion vilket kommer att ersätta vanliga citattecken, streck och uteslutningstecken med deras typografiskt korrekt alternativ. Notera att denna algoritm inte är perfekt så det är värt att granska resultaten. Det omvända, Avförbättra interpunktion, finns också.

Avslutningsvis finns Indatateckenkodning. Äldre dokument anger ibland inte sin teckenkodning. Vi omkodning kan detta resultera i icke-engelska tecken eller specialtecken som smarta citat skadas. calibre försöker att automatiskt detektera teckenkodning av källdokumentet, men det är inte alltid lyckas. Du kan tvinga den att anta en viss teckenkodning med den här inställningen. cp1252 är en gemensam kodning för dokument för Windows-mjukvara. Du bör också läsa char-kodning-faq för mer information om kodningsfrågor.

Layout

Normalt ska stycker/paragrafer i XHTML återges med en tom rad mellan dem och ingen ledande textindrag. calibre har ett par alternativ för att anpassa detta. Ta bort blankrad mellan stycken ser med kraft till att alla stycken har någon bland paragraf/styckesavstånd. Den sätter också textindraget till 1.5em (kan ändras) för att markera början på varje punkt. Infoga tom rad gör det motsatta, som garanterar att det finns exakt en tom rad mellan varje par av stycken. Båda dessa alternativ är mycket omfattande, avlägsna avstånd, eller sätta in den för alla stycken (tekniskt <p> och <div> etiketter). Det är så att du bara kan ställa in alternativet och vara säker på att den presterar som utlovat, oavsett hur rörig indatafilen är. Det enda undantaget är när indatafilen använder hårda radbrytningar att genomföra interstyckeavstånd.

Om du vill ta bort avståndet mellan alla stycken, förutom några få utvalda, använd inte dessa alternativ. Istället lägger du till följande CSS-kod till Extra-CSS:

p, div { margin: 0pt; border: 0pt; text-indent: 1.5em }
.spacious { margin-bottom: 1em; text-indent: 0pt; }

Då, i ditt källdokument, markera de punkter som behöver avståndet med class=”spacious”. Om indatadokumentet inte är i HTML, använd felsökningsalternativet, beskrivet i inledningen till att få HTML (använd input underkatalog).

Ett annat användbart alternativ är Konvertera data i tabeller till linjära data. Några dåligt utformade dokument använder tabeller för att anpassa utformningen på texten på sidan. Vid konvertering har dessa dokument ofta text som rinner ut från sidan och andra artefakter. Detta alternativ kommer att extrahera innehållet från tabellerna och presentera den på ett linjärt sätt. Observera att detta alternativ linjärisera alla bord, så att använd bara den om du är säker indatasdokumentet använder inte tabeller för verkliga ändamål, som att presentera tabellinformation.

Formgivning

Alternativet Extra CSS låter dig ange godtycklig CSS som kommer att tillämpas på alla HTML-filer i inmatningen. Denna CSS appliceras med mycket hög prioritet och bör åsidosätta de flesta CSS närvarande i själva inmatningsdokumentet. Du kan använda denna inställning för att finjustera presentation/utformningen av dokumentet. Till exempel, om du vill att alla stycken i klassen slutnotering att vara högerställda, lägg bara till:

.endnote { text-align: right }

eller om du vill ändra indraget på alla stycken:

p { text-indent: 5mm; }

Extra CSS är ett mycket kraftfullt alternativ, men du behöver en förståelse för hur CSS fungerar för att använda den till sin fulla potential. Du kan använda alternativet felsök rörledningsalternativet som beskrivs ovan för att se vad CSS finns i ditt indatadokument.

Ett enklare alternativ är att använda Filtrera stilinformation. Det här låter dig ta bort alla CSS-egenskaper för de angivna typerna från dokumentet. Du kan till exempel använda den för att ta bort alla färger eller typsnitt.

Omvandla stilar

Detta är den mest kraftfulla stilrelaterade bekvämligheten. Du kan använda den för att definiera regler som ändrar stilar baserat på olika villkor. Till exempel kan du använda den för att ändra alla gröna färger till blåa, eller ta bort alla feta stilar från text eller färga alla rubriker en viss färg, m.m.

Sidinställning

Sidinställningsalternativen är till för att anpassa skärmlayout, som marginaler och skärmstorlekar. Det finns alternativ till sidmarginalsinställningar, som kommer att användas av utdata insticksmodulen, om det valda utmatningsformatet stödjer sidmarginaler. Dessutom bör du välja en inmatningsprofil och en utskriftsprofil. Båda uppsättningarna av profiler i princip behandlar hur man ska tolka mått i dokumentets indata/utdata, skärmstorlekar och standardtypsnitts omskalningsnycklar.

Om du vet att filen du konverterar var avsett att användas på en viss enhet/mjukvaruplattform, välj motsvarande indataprofil, annars bara välj standard indataprofil. Om du vet att filerna som du producerar är avsedda för en viss typ enhet, välj motsvarande resultatprofil. Särskilt för MOBI-utdatafiler, bör du välja Kindle, LIT för Microsoft Reader och EPUB för Sony Reader. I fallet med EPUB kommer Sony Reader profil resultera i EPUB-filer som kommer att fungera överallt. Det har dock vissa biverkningar, som att sätta in konstgjorda avsnittsbrytningar för att hålla interna komponenter under tröskelstorlek, behövs för Sony-enheter. Särskilt för iPhone-/Android-telefoner, välj Sony-utdataprofil. Om du vet att dina EPUB-filer kommer inte att läsas på en Sony eller liknande enhet, använda standard utdataprofil. Om du vill skriva MOBI-filer som inte är avsedda för Kindle, välj utdataprofil för Mobipocket-böcker.

Utdataprofilen styr även skärmstorleken. Detta kommer att orsaka, till exempel bilder som automatiskt storleksändras vara tjänliga till skärmen i vissa utdataformat. Så välj en profil av en enhet som har en skärmstorlek som liknar din enhet.

Heuristisk bearbetning

Heuristisk bearbetning erbjuder en mängd olika funktioner som kan användas för att försöka upptäcka och åtgärda vanliga problem i dåligt formaterade indatadokument. Använd dessa funktioner om ditt indatadokument lider av dålig formatering. Eftersom dessa funktioner är beroende av gemensamma mönster, var medveten om att ett alternativ i vissa fall kan leda till sämre resultat, så använd med försiktighet. Som ett exempel, kommer flera av dessa alternativ ta bort alla icke-blankstegsbrytande entiteter, eller kan innefatta falska positiva resultat avseende funktionen.

Aktivera heuristisk bearbetning
Det här alternativet aktiverar calibres :guilabel:`Heuristisk bearbetnings’-steg av konverteringen. Detta måste vara aktiverat för olika delfunktioner som ska tillämpas
Ta bort radbrytningar
Aktivering av detta alternativ kommer att orsaka att calibre försöker upptäcka och korrigera hårda radbrytningar som finns inom ett dokument med ledtrådar som skiljetecken och linjelängd. calibre kommer först att försöka att upptäcka om hårda radbrytningar finns, om de inte tycks existera calibre kommer inte att försöka ta bort radbrytningar. Radbrytningsfaktor kan minskas om man vill ”tvinga” calibre att veckla ut rader.
Faktor för ta bort radbrytningar
Det här alternativet styr algoritmen calibre använder för att ta bort hårda radbrytningar. Till exempel, om värdet av detta alternativ är 0,4, innebär att calibre kommer att ta bort hårda radbrytningar från slutet av linjer vars längd är mindre än längden på 40% av alla rader i dokumentet. Om dokumentet har bara några radbrytningar som behöver korrigering, då detta värde bör minskas till någonstans mellan 0,1 och 0,2.
Identifiera och markera oformaterade kapitelrubriker och underrubriker

Om dokumentet inte har kapitelrubriker och titlar formaterade annorlunda från resten av texten, kan calibre använda det här alternativet för att försöka detektera dem och omge dem med rubriketiketter. <h2>etiketter används för kapitelrubriker; <h3>etiketter används för några titlar som upptäcks.

Den här funktionen kommer inte att skapa en innehållsförteckning, men i många fall kommer det att orsaka calibre inställningar standard kapitlet upptäckt att korrekt upptäcka kapitel och bygga en innehållsförteckning. Justera XPath enligt Structure detection om eninnehållsförteckning inte skapas automatiskt. Om det inte finns några andra rubriker som används i dokumentet ställ då in inställningen ”//h:h2” under Structure detection skulle vara det enklaste sättet att skapa en innehållsförteckning för dokumentet.

De insatta rubriker är inte formaterad, för att tillämpa formatering använd Extra CSS alternativet under konverteringsinställningar under Utseende och känsla. Till exempel, för att centrera rubriketiketter, använd följande:

h2, h3 { text-align: center }
Renumber sequences of <h1> or <h2> tags
Vissa förlag formaterar kapitelrubriker som använder flera <h1> eller <h2> etiketter sekventiellt. calibres standardkonverteringsinställningar kommer orsaka att sådana titlar delas upp i två delar. Detta alternativ kommer att numrera rubriketiketterna för att undvika delning.
Ta bort tomma rader mellan stycken
Detta alternativ kommer att få calibre att analysera tomma rader som ingår i dokumentet. Om varje stycke interfolierade med en tom rad, då kommer calibre att ta bort alla dessa tomma stycken. Sekvenser av flera tomma rader kommer att betraktas som scenbrytning och behållas som ett enda stycke. Detta alternativ skiljer sig från ’Ta bort styckesavstånd ”alternativ under” Utseende och känsla ”i att det faktiskt ändrar HTML-innehåll, medan det andra alternativet ändrar dokumentmallar. Detta alternativ kan också ta bort stycken som infogats med hjälp av calibres ”Infoga tom rad” alternativ.
Se till att scenavbrytning är konsekvent formaterade
Med detta alternativ kommer calibre att försöka upptäcka vanliga scen-brytmarkörer och se till att de är centrerad. ”Mjuka” scenavbrytningsmarkörer, d.v.s. scenavbrytning definieras endast av extra tomrum, är utformade för att säkerställa att de inte kommer att visas i samband med sidbrytningar.
Ersätt scenbrytningar

Om det här alternativet konfigureras sedan ersätter calibre scenbrytningsmarkörer som hittas med den nya texten som anges av användaren. Observera att vissa prydnadstecken kanske inte stöds i alla läser enheter.

Generellt bör man undvika att använda html-etiketter, calibre kommer bortse från några etiketter och använda fördefinierade uppmärkning. <hr /> etiketter, det vill säga övergripande regler och <img> etiketter undantages. Horisontella regler kan eventuellt fås med stilar, om du väljer att lägga till din egen stil se till att inkludera ”bredd”-inställning, annars informations stilen kommer att slängas. Bildetiketter kan användas, men calibre ger inte möjlighet att lägga till bilden under konverteringen, måste detta ske i efterhand med hjälp av ”Redigera bok” funktionen.

Exempel bildetiketter (placera bilden i en ”Bilder”-mapp inne i epub:en efter konvertering):
<img style=”width:10%” src=”../Images/scenebreak.png” />
Exempel horisontell linje med stilar:
<hr style=”width:20%;padding-top: 1px;border-top: 2px ridge black;border-bottom: 2px groove black;”/>
Ta bort onödiga bindestreck
calibre kommer att analysera alla bindestrecksinnehåll i dokumentet när det här alternativet är aktiverat. Dokumentet i sig används som ett lexikon för analys. Detta gör calibre att noggrant ta bort bindestreck för något ord i dokumentet på något språk, tillsammans med påhittade och obskyra vetenskapliga ord. Den primära nackdelen är ord som förekommer endast en gång i dokumentet ändras inte. Analys sker i två omgångar, det första passet analyserar radslut. Linjer är bara oförpackade om ordet finns med eller utan bindestreck i dokumentet. Det andra passet analyserar alla ord med bindestreck i hela dokumentet, bindestreck tas bort om ordet förekommer på andra ställen i dokumentet utan träff.
Kursivera vanliga ord och mönster
När funktionen är aktiverad kommer calibre söka efter vanliga ord och mönster som betecknar kursiv och kursivera dem. Exempel är vanliga textkonventioner såsom ~ordet~ eller fraser som generellt bör vara kursiv, t.ex. latinska fraser som ”etc.” eller ”et cetera”.
Ersätt enhetsindrag med CSS-indrag
Vissa dokument använder en konvention att definiera textindrag med att använd hårda blankstegs enheter. När det här alternativet är aktiverat calibre kommer att försöka upptäcka denna typ av formatering och konvertera dem till en 3% textindrag hjälp av CSS.

Sök & ersätt

De här alternativen är användbart främst för konvertering av PDF-dokument eller OCR konverteringar, även om de också kan användas för att åtgärda många dokument-specifika problem. Som ett exempel kan lämna bladen bakom rubrik och sidfot i texten några konverteringar. Dessa alternativ använder vanliga uttryck för att försöka upptäcka sidrubriken, sidfötter eller annan godtycklig text och ta bort eller ersätta dem. Kom ihåg att de är verksamma på mellan XHTML producerad av konverteringsrörledning. Det finns en guide som hjälper dig att anpassa de reguljära uttryck för dokumentet. Klicka på trollstaven bredvid uttrycksrutan och klicka på knappen ”Test” efter att komponerat ditt sökuttryck. Framgångsrika träffar kommer att markeras i gult.

Sökningen fungerar med hjälp av ett Python-reguljärt uttryck. Allt matchad text tas helt enkelt bort från dokumentet eller ersätt med hjälp av ersättningsmönstret. Ersättningsmönster är valfritt, om det lämnas tomt kommer text som matchar sökbegreppet kommer att tas bort från dokumentet. Du kan läsa mer om reguljära uttryck och deras syntax på: ref: regexptutorial.

Struktrurdetektering

Strukturdetektering innebär att calibre försöker sitt bästa för att upptäcka strukturella element i indatadokumentet, när de inte är korrekt angivet. Till exempel, kapitel, sidbrytningar, rubriker, sidfot, o.s.v. Som ni kan föreställa er, varierar denna process mycket från bok till bok. Lyckligtvis har calibre mycket kraftfulla alternativ för att hantera detta. Med makt kommer komplexitet, men om när du tar dig tid att lära sig komplexiteten, upptäcker du att det väl värt ansträngningen.

Kapitel och sidbrytningar

calibre har två uppsättningar av alternativ för kapiteldetektering och infoga sidbrytningar. Detta kan ibland vara lite förvirrande, som standard, kommer calibre infoga sidbrytningar innan upptäckta kapitel samt de platser som upptäckts av alternativet sidbrytningar. Anledningen till detta är att det ofta finns platser där sidbrytningar bör infogas som inte är kapitelgränser. Dessutom upptäckta kapitlen kan eventuellt infogas i den automatiskt genererade innehållsförteckningen.

calibre använder XPath, ett kraftfullt språk för att göra det möjligt för användaren att specificera kapitelgränser/sidbrytningar. XPath kan verka lite skrämmande att använda i början, lyckligtvis finns det en Introduktion i användarhandboken. Kom ihåg att Strukturdetektering fungerar på tillfällig XHTML producerad av konverteringsrörledningen. Använd felsökningsalternativet beskrivs i Introduktion att räkna ut lämpliga inställningar för din bok. Det finns också en knapp för en XPath-guide för att hjälpa till med generering av enkla XPath-uttryck.

Som standard använder calibre följande uttrycker för kapiteldetektering:

//*[((name()='h1' or name()='h2') and re:test(., 'chapter|book|section|part\s+', 'i')) or @class = 'chapter']

Detta uttryck är ganska komplicerat, eftersom det försöker hantera ett antal gemensamma fall samtidigt. Vad det betyder är att calibre antar att kapitel börjar på antingen <h1> eller <h2> etiketter som har något av orden (chapter, book, section eller part) i dem eller som har class = ”chapter” attribut.

Ett relaterat alternativ är Kapitelmärkning, vilket gör att du kan anpassa vad calibre gör när den upptäcker ett kapitel. Som standard kommer den att infoga en sidbrytning före kapitlet. Du kan ha det infoga en styrd linje istället för, eller som komplement till sidbrytning. Du kan också få den göra ingenting.

Standardinställningen för detektering av sidbrytningar är:

//*[name()='h1' or name()='h2']

vilket innebär att calibre kommer att infoga sidbrytningar före varje <h1> och <h2 etikett som standard.

Observera

Standarduttryck kan ändras beroende på inmatningsformat du konverterar.

Diverse

Det finns några fler alternativ i det här avsnittet.

Infoga metadata som en sida i början av boken
En av de bästa sakerna med calibre är att det tillåter dig att behålla mycket komplett metadata om alla dina böcker, till exempel, ett betyg, etiketter, kommentarer, o.s.v. Detta alternativ kommer att skapa en enda sida med all denna metadata och sätta in den i den konverterade e-boken, typiskt just efter omslaget. Se det som ett sätt att skapa egna bokomslag.
Ta bort första bilden
Ibland innehåller källdokumentet du konverterar omslaget som en del av boken, istället för som ett separat omslag. Om du också ange ett omslag i calibre, den då konverterade boken kommer att ha två omslag. Detta alternativ kommer att helt enkelt ta bort den första bilden från källdokumentet, vilket säkerställer att den konverterade boken har bara ett omslag, det som anges i calibre.

Innehållsförteckning

När indatadokumentet har en innehållsförteckning i sitt metadata, kommer calibre bara använda det. Men ett antal äldre format stöder antingen inte metadata baserade innehållsförteckning, eller enskilda dokument har inte en. I dessa fall kan alternativen i det här avsnittet automatiskt hjälp dig generera en innehållsförteckning i den konverterade e-bok, baserat på det faktiska innehållet i inmatningsdokumentet.

Observera

Det kan vara lite utmanande att få exakt rätt med hjälp av dessa alternativ. Om du föredrar att skapa/redigera innehållsförteckningen för hand, konvertera till EPUB- eller AZW3-format och välja kryssrutan längst ner i innehållsförteckningen i konverteringsdialogrutan som säger Manuellt finjustera innehållsförteckning efter konverteringen är klar. Detta startar Redigeraren för innehållsförteckningen efter konverteringen. Det låter dig skapa poster i innehållsförteckningen genom att klicka på platsen i boken där du vill att posten ska peka till. Du kan också använda Innehållsförteckningensredigeraren själv, utan att göra en konvertering. Gå till Inställningar → Gränssnitt → Verktygsfält och lägga till Innehållsförteckningensredigeraren till huvudverktygsfältet. Sedan är det bara att välja den bok du vill redigera och klicka på knappen Innehållsförteckningensredigeraren.

Det första alternativet är Använd alltid den automatiskt genererade innehållsförteckningen. Genom att markera det här alternativet kan du låta calibre åsidosätta innehållsförteckning som finns i metadata för indatadokumentet med automatiskt genererade en.

Det normala sättet att skapandet av autogenererade innehållsförteckningen fungerar är att, calibre först kommer att försöka lägga alla upptäckta kapitel till den genererade innehållsförteckningen. Du kan lära dig hur du anpassar upptäckt av kapitel i Struktrurdetektering ovan. Om du inte vill ha med ett detekterade kapitel i den genererade innehållsförteckningen, se Lägg inte till upptäcka kapitel i innehållsförteckningen-alternativet.

Om mindre än Kapiteltröskel antal kapitel hittades kommer calibre lägga till alla hyperlänkar som hittas i indatadokumentet till innehållsförteckningen. Detta fungerar ofta väl, många indatadokument innehåller en hyperlänkad innehållsförteckning precis i början. Antal länkar alternativet kan användas för att anpassa detta beteende. Om värdet är noll, kommer inga länkar läggas till. Om inställt till ett tal större än noll, kommer på sin höjd att antalet länkar läggs till.

calibre kommer automatiskt att filtrera dubbletter från den genererade innehållsförteckningen. Men om det finns några ytterligare oönskade poster kan du filtrera dem genom att använda Innehållsförteckningsfilter-alternativet. Detta är ett reguljärt uttryck som söker titeln på poster i den genererade innehållsförteckningen. När en träff hittas, kommer den att tas bort. Till exempel, för att ta bort alla titlar ”Nästa” eller ”Föregående” användning:

Next|Previous

Med Nivå 1,2,3 innehållsförteckning-alternativet kan du skapa en sofistikerad flera nivåer Innehållsförteckning. De är XPath-uttryck som passar etiketter i medan XHTML produceras av konverteringsrörledningen. Se Introduktion för hur du får tillgång till denna XHTML. Läs också XPath-handledning, att lära sig att konstruera XPath-uttryck. Bredvid varje alternativ finns en knapp som startar en guide för att hjälpa till med att skapa grundläggande XPath-uttryck. Följande enkla exempel visar hur man använder de här alternativen.

Anta att du har en indatadokument som resulterar i XHTML som ser ut så här:

<html xmlns="http://www.w3.org/1999/xhtml">
    <head>
        <title>Sample document</title>
    </head>
    <body>
        <h1>Chapter 1</h1>
        ...
        <h2>Section 1.1</h2>
        ...
        <h2>Section 1.2</h2>
        ...
        <h1>Chapter 2</h1>
        ...
        <h2>Section 2.1</h2>
        ...
    </body>
</html>

Sedan anger vi alternativ som:

Level 1 TOC : //h:h1
Level 2 TOC : //h:h2

Detta kommer att resultera i ett automatiskt genererat tvånivåers Innehållsförteckning som ser ut som:

Chapter 1
    Section 1.1
    Section 1.2
Chapter 2
    Section 2.1

Varning

Inte alla utdataformat stödjer en innehållsförteckning med multinivåer. Du bör först försöka med EPUB-utdata. Om det fungerar, sedan prova ditt var av format.

Använda bilder som kapitelrubriker vid konvertering av HTML-inmatningsdokument

Anta att du vill använda en bild som din kapitelrubrik, men ändå vill kunna att calibre automatiskt generera en innehållsförteckning för dig från kapiteltitlar. Använd följande HTML-kod för att uppnå detta

<html>
    <body>
        <h2>Chapter 1</h2>
        <p>chapter 1 text...</p>
        <h2 title="Chapter 2"><img src="chapter2.jpg" /></h2>
        <p>chapter 2 text...</p>
    </body>
</html>

Ändra Nivå 1 innehållsförteckning inställning till //h:h2. Då, för kapitel två, kommer calibre ta titeln från värdet av titel-attribut på ``<h2> `` etikett, eftersom etiketten inte har någon text.

Använda etikettattribut för att leverera texten för posterna i innehållsförteckningen

Om du har speciellt långa kapitelrubriker och vill förkortade versioner i innehållsförteckningen, kan du använda attributet titel för att uppnå detta, till exempel:

<html>
    <body>
        <h2 title="Chapter 1">Chapter 1: Some very long title</h2>
        <p>chapter 1 text...</p>
        <h2 title="Chapter 2">Chapter 2: Some other very long title</h2>
        <p>chapter 2 text...</p>
    </body>
</html>

Ändra Nivå 1 TOC inställning till //h:h2/@titel. Då tar calibre titeln från värdet på titel attribut på <h2> etiketter, istället för att använda texten i etiketten. Observera den avslutande /@titel på XPath-uttryck kan du använda det här formuläret för att berätta calibre för att få text från alla attribut du vill.

Hur alternativen är inställda/sparade för Konvertering

Det finns två platser där konverteringsalternativ kan ställas in i calibre. Den första är i Inställningar->Konvertering. Dessa inställningar är standardinställningar för konverteringsalternativen. När du försöker konvertera en ny bok kommer inställningarna som finns här användas som standard.

Du kan också ändra inställningarna i dialogrutan konvertering för varje bokkonvertering. När du konverterar en bok, minns calibre de inställningar du använt för den boken, så att om du konverterar det igen, kommer de sparade inställningarna för den enskilde boken har företräde framför standardinställningarna som anges i Inställningar. Du kan återställa enskilda inställningar till standard genom att använda Återställ till standardvärden-knappen i individuell bokkonverteringsdialog. Du kan ta bort sparade inställningar för en grupp av böcker genom att välja alla böcker och sedan klicka på knappen Redigera metadata för redigeringsdialogen att massändra metadata, nära botten av dialogen är ett alternativ att ta bort lagrade konverteringsinställningar.

När du masskonvertera en uppsättning böcker, tas inställningarna i följande ordning (sista vinner):

  • Från standardvärdena som i Inställningar->Konvertering
  • Från de sparade konverteringsinställningarna för varje bok som konverteras (om någon). Detta kan stängas av alternativ i det övre vänstra hörnet av dialogrutan masskonvertering.
  • Från inställningarna i masskonverteringsdialogen

Observera att de slutliga inställningar för varje bok i en masskonvertering kommer att sparas och återanvändas om boken konverteras igen. Eftersom högsta prioritet av masskonvertering ges till inställningarna av dialogrutan masskonvertering kommer dessa åsidosätta bokens specifika inställningar. Så du ska bara masskonvertera böcker tillsammans som behöver liknande inställningar. Undantaget är metadata och specifika inställningar för indataformat. Eftersom masskonveringsdialogrutan inte har inställningar för dessa två kategorier, kommer de att tas från boken specifika inställningar (om någon) eller standardvärdena.

Observera

Du kan se de verkliga inställningar som används under någon konvertering genom att klicka på roterande ikon i det nedre högra hörnet och sedan dubbelklicka på individuella konverteringsjobbet. Då visas en konverteringslogg som ska innehålla de verkliga inställningar som används, nära toppen.

Formatspecifika tips

Här hittar du tips som är specifika för konvertering av vissa format. Alternativ specifika för visst format, oavsett indata eller utdata finns i dialogrutan konvertering under eget avsnitt, till exempel TXT-indata eller EPUB-utdata.

Konvertera Microsoft Word dokument

calibre kan automatiskt konvertera .docx-filer som skapats av Microsoft Word 2007 och nyare. Lägg bara till filen till calibre och tryck konvertera (se till att du kör den senaste versionen av calibre eftersom stöd för .docx-filer är mycket nytt).

Observera

Det finns en demo .docx-fil som demonstrerar förmågorna hos calibres konverteringsmotor. Bara hämtar den och omvandla den till EPUB eller AZW3 för att se vad calibre kan göra.

calibre kommer att automatiskt generera en innehållsförteckning som baseras på rubriker om du markerar dina rubriker med Heading 1, ​`Heading 2`, o.s.v. stilar i Microsoft Word. Öppna utdata e-boken i calibre E-bokvisaren och klicka på knappen Innehållsförteckning för att visa den genererade innehållsförteckningen.

Äldre .doc-filer

För äldre DOC-filer, kan du spara dokumentet som HTML med Microsoft Word och sedan konvertera den resulterande HTML-filen med calibre. När du sparar som HTML, se till att använda ”Spara som webbplats, filtrerad” alternativet eftersom detta kommer att producera ren HTML som kommer att konverteras bra. Observera att Word producerar en riktigt rörig HTML, att konvertera det kan ta lång tid, så ha tålamod. Om du har en nyare version av Word tillgänglig kan du också direkt spara den som DOCX.

Ett annat alternativ är att använda fria Openoffice som är gratis. Öppna din DOC fil i Openoffice och spara den i Openoffice formatet .odt. calibre kan direkt konvertera .odt filer.

Konvertera TXT-dokument

TXT-dokument har något väldefinierat sätt att ange formatering som fet, kursiv, o.s.v, eller dokumentstruktur som stycken, rubriker, sektioner och så vidare, men det finns en mängd olika konventioner som vanligen används. Som standard försöker calibre automatisk detektering av korrekt formatering och uppmärkning utifrån dessa konventioner.

TXT-indata stöder ett antal alternativ för att differentiera hur stycken upptäcks.

Styckeformat: automatisk
Analyserar textfilen och försök att automatiskt avgöra hur styckena är definierade. Detta val kommer i allmänhet fungerar bra, om du uppnår oönskade resultat prova ett av de manuella alternativen.
Styckeformat: blockera

Förutsätter en eller flera tomma rader är en styckesgräns:

This is the first.

This is the
second paragraph.
Styckeformat: ensamstående

Förutsätter att varje rad är ett stycke:

This is the first.
This is the second.
This is the third.
Styckeformat: skriv ut

Förutsätter att varje stycke börjar med en indragning (antingen en tabulering eller 2+ blankslag). Styckena avslutas när nästa rad som börjar med en indragning nås:

  This is the
first.
  This is the second.

  This is the
third.
Styckeformat: oformaterad
Förutsätter att dokumentet inte har någon formatering, men använder hårda radbrytningar. Skiljetecken och medianradslängd används för att försöka återskapa stycken.
Formatstil: automatisk
Försök att känna av vilken formateringskod som används. Om ingen kod används kommer heuristisk formatering att tillämpas.
Formatstil: heuristisk
Analyserar dokumentet för gemensamma kapitelrubriker, scenbrytningar och kursiverade ord och tillämpar lämpliga HTML-kod under konverteringen.
Formatstil: Markdown
calibre stöder också kör TXT-indata genom en omvandlings förbehandlare som kallas Markdown. Markdown möjliggör grundläggande formatering som ska läggas till TXT-dokument, till exempel fet, kursiv, avsnittsrubriker, tabeller, listor, en innehållsförteckning, o.s.v. Markeringskapitelrubriker med en ledande # och sätta XPath-kapiteldetekteringsuttryck för ”//h:h1” är det enklaste sättet att få en korrekt innehållsförteckning att genereras från ett TXT-dokument. Du kan läsa mer om Markdown-syntax i daringfireball <https://daringfireball.net/projects/markdown/syntax> _.
Formatstil: none
Använder ingen speciell formatering av texten, dokumentet konverteras till HTML utan några ändringar.

Konvertera PDF-dokument

PDF-dokument är en av de värsta format att konvertera från. De är en fast sidstorlek och textplaceringsformat. Mening, är det mycket svårt att avgöra var en stycke slutar och en annat börjar. calibre kommer att försöka packa stycken med en konfigurerbar, Radbrytningsfaktor. Detta är en skala som används för att bestämma längden, vid vilken en rad bör radbruten. Giltiga värden är ett decimaltal mellan 0 och 1. Standardinställningen är 0,45, strax under medianradslängden. Sänk detta värde att inkludera mer text i uppackning. Öka till att omfatta mindre. Du kan justera detta värde i konverteringsinställningarna under PDF-indata.

De har också ofta rubriker och sidfötter som en del av dokumentet som kommer att bli inkluderat med texten. Använd Sök och ersätt panel för att ta bort rubriker och sidfötter för att lindra problemet. Om rubrikerna och sidfötterna inte tas bort från texten kan den ge upp uppackning. Om du vill veta hur du använder rubriks- och sidfotsborttagningsalternativ, läs Allt om att använda reguljära uttryck i calibre.

Vissa begränsningar på PDF-indata är:

  • Komplex, flera kolumner, och bildbaserade dokument stöds inte.
  • Extraction of vector images and tables from within the document is also not supported.
  • Vissa PDF-filer använder speciella glyfer för att representera ll eller ff eller fi, o.s.v. Konvertering av dessa kanske eller kanske inte fungerar beroende på hur de representeras internt i PDF:n.
  • Länkar och innehållsförteckning stöds inte
  • PDF-filer med inbäddade icke-unicode-typsnitt för att representera icke-engelska tecken kommer att resultera i förvrängt utdata för dessa tecken
  • Vissa PDF-filer är uppbyggda av fotografier av sidan med OCR-text bakom dem. I sådana fall använder calibre OCR-texten, vilket kan vara mycket annorlunda från vad du ser när du visar PDF-filen
  • PDF-filer som används för att visa komplexa text, liksom höger till vänster språk och matematiksättning kommer inte konverteras korrekt

För att återupprepa PDF är en riktigt, riktigt dåligt format att användas som indata. Om du absolut måste använda PDF, sedan förberedas för ett utdata som varierar allt från anständigt att oanvändbara, beroende på indata PDF.

Serietidningssamlingar

En serietidningssamling är en .cbc-fil. En .cbc-fil är en ZIP-fil som innehåller andra CBZ/CBR-filer. Dessutom måste .cbc-filen innehålla en enkel textfil som heter comics.txt, kodade i UTF-8. comics.txt-filen måste innehålla en förteckning över de comics-filerna inuti .cbc-filen i formen filename:title, enligt nedan:

one.cbz:Chapter One
two.cbz:Chapter Two
three.cbz:Chapter Three

.cbc-filen kommer då innehålla:

comics.txt
one.cbz
two.cbz
three.cbz

calibre kommer automatiskt konvertera denna .cbc-fil till en e-bok med en innehållsförteckning som hänvisar till varje uppslagsord i serietidning.txt.

EPUB avancerad formateringsdemo

Olika avancerad formatering för EPUB-filer demonstreras i det här demofil <https://calibre-ebook.com/downloads/demos/demo.epub> _. Filen skapades från handkodat HTML med calibre och är tänkt att användas som en mall för dina egna EPUB skapande insatser.

HTML-källan som det skapades från är tillgänglig demo.zip <https://calibre-ebook.com/downloads/demos/demo.zip> _. De inställningar som används för att skapa EPUB från ZIP-filen är:

ebook-convert demo.zip .epub -vv --authors "Kovid Goyal" --language en --level1-toc '//*[@class="title"]' --disable-font-rescaling --page-breaks-before / --no-default-epub-cover

Observera att eftersom den här filen utforskar potentialen i EPUB, kommer inte de flesta av de avancerade formatering att fungera på läsenheter mindre kapabla än calibres inbyggda EPUB-visare.

Konvertera ODT-dokument

calibre kan direkt konvertera ODT (Opendocument Text) filer. Du bör använda stilar för att formatera ditt dokument och minimera användningen av direkt formatering. När bilder infogas i ditt dokument måste du förankra dem till stycke, förankrade bilder till en sida kommer alla hamna på framsidan av konverteringen.

Om du vill aktivera automatisk detektering av kapitlen, måste du markera dem med inbyggd stilar som kallas ”Rubrik 1”, ”Rubrik 2”, …, ”Rubrik 6 ’(’ Rubrik 1” motsvarar HTML-etiketten <h1> , ”Rubrik 2” till <h2> o.s.v.). När du konverterar i calibre kan du ange vilken stil du använde i ”Identifiera kapitel på” rutan. Exempel:

  • Om du markerar kapitel med stil ”Rubrik 2”, måste du ställa in ”Detektera kapitel på” rutan till //h:h2
  • För en kapslad innehållsförteckning med avsnitt märkta med ”Rubrik 2” och de kapitel som är markerade med ”Rubrik 3” du måste ange //h:h2|//h:h3. På Konvertera - innehållsförteckningssidan inställt den ”nivå 1 innehållsförteckning” rutan till //h:h2 och ”nivå 2 innehållsförteckning” rutan till //h:h3.

Välkända dokumentegenskaper (titel, sökord, beskrivning, skapare) känns igen och calibre kommer att använda den första bilden (inte för liten, och med god aspektförhållande) som omslagsbild.

Det finns också ett avancerat egenskapskonverteringsläge, som aktiveras genom att ställa den anpassade egenskapen opf.metadata (av ”Ja eller Nej” typ) till Ja i ODT-dokumentet (Fil>Egenskaper->Anpassa egenskaper). Om egenskapen detekteras av calibre är följande anpassade egenskaper igenkända (opf.authors åsidosättningar dokumentets skapare):

opf.titlesort
opf.authors
opf.authorsort
opf.publisher
opf.pubdate
opf.isbn
opf.language
opf.series
opf.seriesindex

Utöver detta kan du ange vilken bild som ska användas som omslag genom att namnge den opf.cover (högerklicka, Bild-> Alternativ-> Namn) i ODT. Om ingen bild med detta namn hittas, används den ”smarta” metoden. Eftersom omslagsupptäckt kan leda till dubbla omslag i vissa utdataformat, kommer processen att ta bort stycken (endast om det enda innehållet är omslaget!) från dokumentet. Men detta fungerar bara med namngiven bild!

För att inaktivera omslagsupptäckt kan du ställa in den anpassade egenskapen opf.nocover (’Ja eller Nej’-typ) till Ja i avancerat läge.

Konvertera till PDF

Den första, viktigaste inställningen att bestämma när man konverterar till PDF är sidstorleken. Som standard använder calibre en sidstorlek för ”U.S. Letter”. Du kan ändra detta till en annan standard sidstorlek eller en helt anpassad storlek i avsnittet PDF-utdata sektionen i konverteringsdialogen. Om du skapar en PDF som ska användas på en viss enhet kan du slå på alternativet för att använda sidstorleken från utdata-profil istället. Så om din utskriftsprofil är inställd på Kindle, kommer calibre att skapa en PDF med sidstorlek som är lämplig för visning på den lilla Kindle-skärmen.

Sidhuvuden och sidfötter

Du kan infoga godtyckliga rubrik och sidfot på varje sida i PDF genom att ange rubrik och sidfot mallar. Mallar är bara fragmentsavsnitt av HTML-kod som blir utförda i rubrik och sidfot platser. Till exempel, för att visa sidnummer centrerat längst ner på varje sida, i grönt, använd följande sidfotsmall:

<p style="text-align:center; color:green">Page _PAGENUM_</p>

calibre ersätter automatiskt _PAGENUM_ med det aktuella sidnumret. Du kan även sätta olika innehåll på jämna och udda sidor, till exempel följande rubrikmall visar titeln på udda sidor och författaren på jämna sidor:

<p style="text-align:right"><span class="even_page">_AUTHOR_</span><span class="odd_page"><i>_TITLE_</i></span></p>

calibre ersätter automatiskt _TITLE_ och _AUTHOR_ med titel och författare av dokumentet som konverteras. Du kan även visa text på vänster och höger sida och ändra teckenstorlek, vilket visas med den här rubrikmallen:

<div style="font-size:x-small"><p style="float:left">_TITLE_</p><p style="float:right;"><i>_AUTHOR_</i></p></div>

Detta kommer att visa titeln till vänster och författare till höger, i en teckenstorlek som är mindre än huvudtexten.

Du kan också använda det aktuella avsnittet i mallar, enligt nedan:

<p style="text-align:right">_SECTION_</p>

_SECTION_ Ersätts med oavsett vad namnet på det aktuella avsnittet är. Dessa namn är tagna från metadata Innehåll i dokumentet (PDF Outline). Om dokumentet inte har någon innehållsförteckning då det kommer att ersättas av tom text. Om en enda PDF-sida har flera sektioner, kommer det första avsnittet på sidan användas. Likaså finns det en variabel med namnet _TOP_LEVEL_SECTION_ som kan användas för att ge namnet på den nuvarande toppnivåsektionen.

Du kan även använda javascript inne i rubrik och sidfot mallar, till exempel, kommer följande mall resultera i att sidnummer börjar vid 4 istället för på 1:

<p id="pagenum" style="text-align:center;"></p><script>document.getElementById("pagenum").innerHTML = "" + (_PAGENUM_ + 3)</script>

Observera

När du lägger till rubrik och sidfot se till att du ställa in sidan övre och nedre marginal till tillräckligt stora värden, under avsnittet Sidinställningar i konverteringsdialogrutan.

Utskrivbar/tryckbar innehållsförteckning

Du kan också infoga en utskrift/tryckbar innehållsförteckning i slutet av PDF som listar sidnummer för varje avsnitt. Detta är mycket användbart om du tänker skriva ut PDF till papper. Om du vill använda PDF på en elektronisk produkt, ger PDF Outline denna funktionalitet och är genererad som standard.

Du kan anpassa utseendet på den genererade Innehållsförteckningen med hjälp av extra CSS-konverteringsinställningen under Utseende och känsla delen av konverteringsdialogen. Standard css som används är listade nedan, helt enkelt kopiera den och gör de ändringar du vill.

.calibre-pdf-toc table { width: 100%% }

.calibre-pdf-toc table tr td:last-of-type { text-align: right }

.calibre-pdf-toc .level-0 {
    font-size: larger;
}

.calibre-pdf-toc .level-1 td:first-of-type { padding-left: 1.4em }
.calibre-pdf-toc .level-2 td:first-of-type { padding-left: 2.8em }