சமையல் குறிப்புகளுக்கான ஏபிஐ ஆவணங்கள்¶

சமையல் எழுதுவதற்கான ஏபிஐ வரையறுக்கப்படுகிறது: வகுப்பு: அடிப்படை நியூஸ்ரெசிப்

class calibre.web.feeds.news.BasicNewsRecipe(options, log, progress_reporter)[source]¶

அனைத்து சமையல் குறிப்புகளிலும் தேவையான தர்க்கத்தைக் கொண்ட அடிப்படை வகுப்பு. இந்த வகுப்பில் படிப்படியாக அதிக செயல்பாட்டை மீறுவதன் மூலம், நீங்கள் படிப்படியாக மேலும் தனிப்பயனாக்கப்பட்ட/சக்திவாய்ந்த சமையல் வகைகளை உருவாக்கலாம். சமையல் குறிப்புகளை உருவாக்குவதற்கான ஒரு பயிற்சி அறிமுகத்திற்கு, காண்க: டாக்: செய்தி.

abort_article(msg=None)[source]¶: தற்போதைய கட்டுரைக்கான பதிவிறக்கத்தை நிறுத்துவதற்கு எந்தவொரு முன் செயலாக்க முறைகளிலும் இந்த முறையை அழைக்கவும். தூய வீடியோ கட்டுரைகள் போன்ற பொருத்தமற்ற உள்ளடக்கத்தைக் கொண்ட கட்டுரைகளைத் தவிர்க்க பயனுள்ளதாக இருக்கும்.

abort_recipe_processing(msg)[source]¶: ரெசிபி பதிவிறக்க முறை இந்த செய்முறையின் பதிவிறக்கத்தை நிறுத்தி, பயனருக்கு எளிய பின்னூட்ட செய்தியைக் காண்பிக்கும்.

add_toc_thumbnail(article, src)[source]¶: உள்ளடக்க அட்டவணையில் உள்ள கட்டுரையை குறிக்கும் சிறுபடமாக பயன்படுத்த பொருத்தமான கட்டுரையிலிருந்து <img> குறிச்சொல்லின் எஸ்.ஆர்.சி பண்புக்கூறுடன் இதை மக்கள் தொகை_ஆர்டிகல்_மெட்டாடேட்டாவிலிருந்து அழைக்கவும். சிறுபடம் உண்மையில் பயன்படுத்தப்படுகிறதா என்பது சாதனத்தை சார்ந்தது (தற்போது கின்டில்ஸால் மட்டுமே பயன்படுத்தப்படுகிறது). குறிப்பிடப்பட்ட படம் வெற்றிகரமாக பதிவிறக்கம் செய்யப்பட்ட ஒன்றாக இருக்க வேண்டும் என்பதை நினைவில் கொள்க, இல்லையெனில் அது புறக்கணிக்கப்படும்.

classmethod adeify_images(soup)[source]¶: அடோப் டிஜிட்டல் பதிப்புகளில் பார்க்கும்போது உங்கள் செய்முறைக்கு EPUB ஆக மாற்றும்போது படங்களுடன் சிக்கல்கள் இருந்தால், இந்த முறையை உள்ளே இருந்து அழைக்கவும்: மெத்: `போஸ்ட்ரோசஸ்_ஹெச்.டி.எம்.எல்.

canonicalize_internal_url(url, is_link=True)[source]¶

`` Url`` இன் நியமன பிரதிநிதித்துவங்களின் தொகுப்பைத் தரவும். இயல்புநிலை செயல்படுத்தல் எந்தவொரு வினவல் அளவுருக்கள், துண்டுகள் போன்றவற்றைப் புறக்கணித்து, சேவையக ஹோஸ்ட்பெயர் மற்றும் URL இன் பாதையைப் பயன்படுத்துகிறது. இந்த செய்தி மூலத்திற்கான அனைத்து URL களிலும் நியமன பிரதிநிதித்துவங்கள் தனித்துவமாக இருக்க வேண்டும். அவை இல்லையென்றால், உள் இணைப்புகள் தவறாக தீர்க்கப்படலாம்.

அளவுருக்கள்:: is_link -- HTML கோப்பில் உள்ள உள் இணைப்பிலிருந்து URL வந்தால் உண்மை. ஒரு கட்டுரையைப் பதிவிறக்குவதற்கு URL என்பது URL என்றால் தவறு.

cleanup()[source]¶: எல்லா கட்டுரைகளும் பதிவிறக்கம் செய்யப்பட்ட பிறகு அழைக்கப்பட்டன. சந்தா தளங்கள் போன்றவற்றிலிருந்து வெளியேறுவது போன்ற எந்த தூய்மைப்படுத்தலையும் செய்ய இதைப் பயன்படுத்தவும்.

clone_browser(br)[source]¶

உலாவியை குளோன் செய்யுங்கள் br. குளோன் செய்யப்பட்ட உலாவிகள் பல திரிக்கப்பட்ட பதிவிறக்கங்களுக்கு பயன்படுத்தப்படுகின்றன, ஏனெனில் இயந்திரமயமாக்கல் நூல் பாதுகாப்பானது அல்ல. இயல்புநிலை குளோனிங் நடைமுறைகள் பெரும்பாலான உலாவி தனிப்பயனாக்கத்தைக் கைப்பற்ற வேண்டும், ஆனால் உங்கள் செய்முறையில் நீங்கள் கவர்ச்சியான ஏதாவது செய்தால், உங்கள் செய்முறையிலும், குளோனிலும் இந்த முறையை கைமுறையாக மீற வேண்டும்.

குக்கீ கையாளுதலைத் தனிப்பயனாக்காவிட்டால், குளோன் செய்யப்பட்ட உலாவி நிகழ்வுகள் இயல்பாகவே, நூல்-பாதுகாப்பான குக்கீஜாரைப் பயன்படுத்துகின்றன.

default_cover(cover_file)[source]¶: கவர் இல்லாத சமையல் குறிப்புகளுக்கு பொதுவான அட்டையை உருவாக்கவும்

download()[source]¶: இந்த செய்முறையில் உள்ள ஊட்டங்களிலிருந்து அனைத்து கட்டுரைகளையும் பதிவிறக்கம் செய்து முன் செயலாக்குங்கள். இந்த முறையை ஒரு குறிப்பிட்ட செய்முறை நிகழ்வில் ஒரு முறை மட்டுமே அழைக்க வேண்டும். இதை ஒன்றுக்கு மேற்பட்ட முறை அழைப்பது வரையறுக்கப்படாத நடத்தைக்கு வழிவகுக்கும். : திரும்ப: குறியீட்டுக்கான பாதை. Html

extract_readable_article(html, url)[source]¶: 'HTML' இலிருந்து முக்கிய கட்டுரை உள்ளடக்கத்தை பிரித்தெடுக்கிறது, சுத்தப்படுத்தி (கட்டுரை_ஹெச்.டி.எம்.எல், பிரித்தெடுக்கப்பட்ட_டிடில்) டப்பிள் என திரும்பும். ARC90 ஆல் அசல் வாசிப்பு வழிமுறையின் அடிப்படையில்.

get_article_url(article)[source]¶: ஒவ்வொரு கட்டுரைக்கும் உள்ளடக்கத்தை சுட்டிக்காட்டும்: கால: url இன் பிரித்தெடுத்தலைத் தனிப்பயனாக்க ஒரு துணைப்பிரிவில் மேலெழுதவும். கட்டுரை URL ஐ திருப்பி விடுங்கள். இது கட்டுரை என்று அழைக்கப்படுகிறது, இது ஒரு ஊட்டத்திலிருந்து ஒரு பாகுபடுத்தப்பட்ட கட்டுரையை குறிக்கும். Feedparser <https://pythonhosted.org/feedparser/> _ ஐப் பார்க்கவும். முன்னிருப்பாக இது அசல் இணைப்பைத் தேடுகிறது (ஃபீட்பர்னர் அல்லது ஃபீடோ போன்ற ஒரு சேவையின் வழியாக ஒத்திசைக்கப்படும் ஊட்டங்களுக்கு) மற்றும் கண்டுபிடிக்கப்பட்டால், அதைத் தருகிறது அல்லது `கட்டுரையை அளிக்கிறது. html> `_.

get_browser(*args, **kwargs)[source]¶

வலையிலிருந்து ஆவணங்களைப் பெற பயன்படும் உலாவி உதாரணத்தைத் தரவும். இயல்பாக இது இயந்திரமயமாக்கல் <https://mechanize.readthedocs.io/en/latest/> _ _ _ _ குக்கீகளை ஆதரிக்கும், ரோபோக்களை புறக்கணிக்கிறது, புதுப்பிப்புகளை கையாளுகிறது மற்றும் மொஸில்லா பயனர் பயனர் முகவரைக் கொண்டுள்ளது.

உங்கள் செய்முறைக்கு நீங்கள் முதலில் உள்நுழைய வேண்டும் என்றால், உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுதவும். எடுத்துக்காட்டாக, முழு அணுகலுக்காக உள்நுழைய நியூயார்க் டைம்ஸ் செய்முறையில் பின்வரும் குறியீடு பயன்படுத்தப்படுகிறது

def get_browser(self):
    br = BasicNewsRecipe.get_browser(self)
    if self.username is not None and self.password is not None:
        br.open('https://www.nytimes.com/auth/login')
        br.select_form(name='login')
        br['USERID']   = self.username
        br['PASSWORD'] = self.password
        br.submit()
    return br

get_cover_url()[source]¶: திரும்பவும் ஒரு: கால: url இந்த சிக்கலுக்கான கவர் படத்திற்கு அல்லது` எதுவுமில்லை '. இயல்பாக இது உறுப்பினரின் self.cover_url இன் மதிப்பை வழங்குகிறது, இது பொதுவாக` எதுவுமில்லை. உங்கள் செய்முறையானது உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுதும் மின் புத்தகத்திற்கான ஒரு அட்டையை பதிவிறக்கம் செய்ய விரும்பினால், அல்லது இந்த முறை அழைக்கப்படுவதற்கு முன்பு உறுப்பினர் மாறியை self.cover_url ஐ அமைக்கவும்.

get_extra_css()[source]¶: இயல்பாக self.extra_css ஐ வழங்குகிறது. மேலெழுதவும் நீங்கள் கூடுதல்_சிஎஸ்ஸை நிரல் முறையில் உருவாக்க விரும்பினால்.

get_feeds()[source]¶: இந்த சுயவிவரத்தைப் பெற rss ஊட்டங்கள். பட்டியலின் ஒவ்வொரு உறுப்புகளும் படிவத்தின் 2-உறுப்பு டூப்பலாக இருக்க வேண்டும் (தலைப்பு, URL). தலைப்பு எதுவுமில்லை அல்லது வெற்று சரம் என்றால், ஊட்டத்திலிருந்து தலைப்பு பயன்படுத்தப்படுகிறது. பதிவிறக்கம் செய்ய ஊட்டங்களின் பட்டியலைக் கண்டுபிடிக்க உங்கள் செய்முறை சில செயலாக்கங்களைச் செய்ய வேண்டுமானால் இந்த முறை பயனுள்ளதாக இருக்கும். அப்படியானால், உங்கள் துணைப்பிரிவில் மேலெழுதவும்.

get_masthead_title()[source]¶: செய்முறை தலைப்பைத் தவிர வேறு ஒன்றைப் பயன்படுத்த துணைப்பிரிவில் மேலெழுதவும்

get_masthead_url()[source]¶: திரும்பவும் ஒரு: கால: url இந்த சிக்கலுக்காக மாஸ்ட்ஹெட் படத்திற்கு அல்லது` எதுவுமில்லை '. இயல்பாக இது உறுப்பினரின் self.masthead_url இன் மதிப்பை வழங்குகிறது, இது பொதுவாக` எதுவுமில்லை. உங்கள் செய்முறையை மின் புத்தகத்திற்கான ஒரு மாஸ்ட்ஹெட்டை பதிவிறக்கம் செய்ய விரும்பினால், இந்த முறையை உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுத வேண்டும், அல்லது இந்த முறை அழைக்கப்படுவதற்கு முன்பு உறுப்பினர் மாறியை `சுய. மாஸ்ட்ஹெட் படங்கள் கின்டெல் மொபி கோப்புகளில் பயன்படுத்தப்படுகின்றன.

get_obfuscated_article(url)[source]¶

நீங்கள் articles_are_obfuscated ஐ அமைத்தால் இந்த முறை ஒவ்வொரு கட்டுரை URL க்கும் அழைக்கப்படுகிறது. இது HTML கட்டுரையைக் கொண்ட கோப்பு முறைமையில் ஒரு கோப்பிற்கு பாதையை திருப்பித் தர வேண்டும். அந்த கோப்பு சுழல்நிலை HTML பெறுதல் இயந்திரத்தால் செயலாக்கப்படுகிறது, எனவே இது வலையில் பக்கங்கள்/படங்களுக்கான இணைப்புகளைக் கொண்டிருக்கலாம். மாற்றாக, நீங்கள் படிவத்தின் அகராதியை திருப்பித் தரலாம்: {'தரவு': <html தரவு>, 'url': <கட்டுரையின் தீர்க்கப்பட்ட URL>}. இது தற்காலிக கோப்புகளை உருவாக்கத் தவிர்க்கிறது. கட்டுரையின் பயனுள்ள URL இந்த முறைக்கு அனுப்பப்பட்ட URL இலிருந்து வேறுபட்டால், அகராதியில் உள்ள url விசை பயனுள்ளதாக இருக்கும், எடுத்துக்காட்டாக, வழிமாற்றுகள் காரணமாக. URL மாறாமல் இருந்தால் அதை தவிர்க்கலாம்.

கட்டுரை உள்ளடக்கத்தை தானாக அணுகுவதை கடினமாக்க முயற்சிக்கும் தளங்களுக்கு இந்த முறை பொதுவாக பயனுள்ளதாக இருக்கும்.

get_url_specific_delay(url)[source]¶

இந்த URL ஐ பதிவிறக்குவதற்கு முன் விநாடிகளில் தாமதத்தைத் தரவும். குறிப்பிட்ட URL க்கான தாமதத்தை நீங்கள் நிரல் ரீதியாக தீர்மானிக்க விரும்பினால், உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுதவும், நீங்கள் பாதிக்க விரும்பாத URL களுக்கு இயல்புநிலையாக சுய.

வருமானம்:: ஒரு மிதக்கும் புள்ளி எண், விநாடிகளின் தாமதம்.

classmethod image_url_processor(baseurl, url)[source]¶: பட URL களில் சில செயலாக்கத்தைச் செய்யுங்கள் (ஒருவேளை மாறும் வகையில் உருவாக்கப்பட்ட படங்களுக்கான அளவு கட்டுப்பாடுகளை நீக்குகிறது) மற்றும் முன்னோடி URL ஐத் தரவும். படத்தைப் பெறுவதைத் தவிர்க்க எதுவும் அல்லது வெற்று சரம் திரும்பவும்.

index_to_soup(url_or_raw, raw=False, as_tree=False, save_raw=None)[source]¶

குறியீட்டு பக்கத்திற்கு ஒரு URL ஐ எடுத்து `பியூட்டிஃபுல் சப்பை <https://www.crummic.com/software/beautifulsoup/bs4/doc> __ __.

url_or_raw: ஒரு URL அல்லது பதிவிறக்கம் செய்யப்பட்ட குறியீட்டு பக்கத்தை ஒரு சரமாக

is_link_wanted(url, tag)[source]¶

இணைப்பைப் பின்பற்ற வேண்டும் அல்லது இல்லையெனில் தவறானது என்றால் உண்மையாக திரும்பவும். இயல்பாக, NOTIMPLEMENTEDERROR ஐ உயர்த்துகிறது, இது பதிவிறக்கத்தை புறக்கணிக்க காரணமாகிறது.

அளவுருக்கள்:

url -- பின்பற்றப்பட வேண்டிய URL
tag -- URL எந்த குறிச்சொல் பெறப்பட்டது

parse_feeds()[source]¶: திரும்பிய ஊட்டங்களின் பட்டியலிலிருந்து கட்டுரைகளின் பட்டியலை உருவாக்கவும்: மெத்: BasicNewsRecipe.get_feeds. ஒரு பட்டியலைத் தரவும்: வகுப்பு: ஊட்டம் பொருள்கள்.

parse_index()[source]¶

கட்டுரைகளின் பட்டியலை உருவாக்க ஊட்டங்களுக்கு பதிலாக ஒரு வலைத்தளத்தை அலசும் சமையல் குறிப்புகளில் இந்த முறை செயல்படுத்தப்பட வேண்டும். தற்போதைய அச்சு பதிப்பில் உள்ள அனைத்து கட்டுரைகளையும் பட்டியலிடும் "அச்சு பதிப்பு" வலைப்பக்கத்தைக் கொண்ட செய்தி ஆதாரங்களுக்கான வழக்கமான பயன்பாடுகள். இந்த செயல்பாடு செயல்படுத்தப்பட்டால், அது முன்னுரிமை அளிக்கப்படும்: METH: BasicNewsRecipe.Parse_feeds.

அது ஒரு பட்டியலைத் திருப்பித் தர வேண்டும். பட்டியலின் ஒவ்வொரு உறுப்புகளும் `` ('ஊட்ட தலைப்பு', கட்டுரைகளின் பட்டியல்) `` வடிவத்தின் 2-உறுப்பு டூப்பலாக இருக்க வேண்டும்.

கட்டுரைகளின் ஒவ்வொரு பட்டியலிலும் படிவத்தின் அகராதிகள் இருக்க வேண்டும்

{
'title'       : article title,
'url'         : URL of print version,
'date'        : The publication date of the article as a string,
'description' : A summary of the article
'content'     : The full article (can be an empty string). Obsolete
                do not use, instead save the content to a temporary
                file and pass a file:///path/to/temp/file.html as
                the URL.
}

எடுத்துக்காட்டுக்கு, அட்லாண்டிக் பதிவிறக்குவதற்கான செய்முறையைப் பார்க்கவும். கூடுதலாக, கட்டுரையின் ஆசிரியருக்கு 'எழுத்தாளரை' சேர்க்கலாம்.

நீங்கள் சில காரணங்களால் செயலாக்கத்தை நிறுத்த விரும்பினால், பிழைக்கு பதிலாக பயனருக்கு ஒரு எளிய செய்தியைக் காட்டினால், அழைக்கவும்: மெத்: abort_recipe_processing.

populate_article_metadata(article, soup, first)[source]¶

கட்டுரைக்கு சொந்தமான ஒவ்வொரு HTML பக்கமும் பதிவிறக்கம் செய்யப்படும் போது அழைக்கப்படுகிறது. ஆசிரியர்/சுருக்கம்/போன்ற கட்டுரை மெட்டாடேட்டாவைப் பெற பயன்படுத்தப்பட வேண்டும். பாகுபடுத்தப்பட்ட HTML (சூப்) இலிருந்து.

அளவுருக்கள்:

article -- வகுப்பின் ஒரு பொருள்: வகுப்பு: calibre.web.feeds.article. நீங்கள் சுருக்கத்தை மாற்றினால், உரையை மாற்றவும் நினைவில் கொள்ளுங்கள்
soup -- இந்த கட்டுரையைச் சேர்ந்த பாகுபடுத்தப்பட்ட HTML
first -- உண்மை iff பாகுபடுத்தப்பட்ட HTML என்பது கட்டுரையின் முதல் பக்கம்.

postprocess_book(oeb, opts, log)[source]¶

பாகுபடுத்தப்பட்ட பதிவிறக்கம் செய்யப்பட்ட மின் புத்தகத்தில் தேவையான இடுகை செயலாக்கத்தை இயக்கவும்.

அளவுருக்கள்:

oeb -- ஒரு OEBBOOK பொருள்
opts -- மாற்று விருப்பங்கள்

postprocess_html(soup, first_fetch)[source]¶

பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு மூலத்துடனும் இந்த முறை அழைக்கப்படுகிறது: கால: HTML கோப்பு, இது இணைப்புகள் மற்றும் படங்களுக்காக பாகுபடுத்தப்பட்ட பிறகு. : கால: html இல் தன்னிச்சையாக சக்திவாய்ந்த பிந்தைய செயலாக்கத்தை செய்ய இதைப் பயன்படுத்தலாம். அதை செயலாக்கிய பிறகு அது சூப் திரும்ப வேண்டும்.

அளவுருக்கள்:

soup -- ஒரு அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> __ பதிவிறக்கம் செய்யப்பட்டுள்ள நிகழ்வு: கால: html`.
first_fetch -- இது ஒரு கட்டுரையின் முதல் பக்கம் என்றால் உண்மை.

preprocess_html(soup)[source]¶

பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு மூலத்துடனும் இந்த முறை அழைக்கப்படுகிறது: கால: html கோப்பு, இது இணைப்புகள் மற்றும் படங்களுக்கு பாகுபடுத்தப்படுவதற்கு முன்பு. Remove_Tags போன்றவற்றால் குறிப்பிடப்பட்டுள்ளபடி இது தூய்மைப்படுத்தலுக்குப் பிறகு அழைக்கப்படுகிறது. இது தன்னிச்சையாக சக்திவாய்ந்த முன் செயலாக்கத்தை செய்ய பயன்படுத்தப்படலாம்: கால: html. அதை செயலாக்கிய பிறகு அது சூப் திரும்ப வேண்டும்.

சூப்: ஒரு` அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> __ பதிவிறக்கம் செய்யப்பட்டுள்ள நிகழ்வு: கால: html.

preprocess_image(img_data, image_url)[source]¶: பதிவிறக்கம் செய்யப்பட்ட படத் தரவில் சில செயலாக்கத்தைச் செய்யுங்கள். எந்தவொரு மறுஅளவிடுதலும் செய்யப்படுவதற்கு முன்பு இது மூல தரவுகளில் அழைக்கப்படுகிறது. செயலாக்கப்பட்ட மூல தரவை திருப்பித் தர வேண்டும். படத்தைத் தவிர்க்க எதுவும் திரும்பவும்.

preprocess_raw_html(raw_html, url)[source]¶

பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு மூலத்துடனும் இந்த முறை அழைக்கப்படுகிறது: சொல்: html கோப்பு, ஒரு பொருள் மரத்தில் பாகுபடுத்தப்படுவதற்கு முன்பு. RAW_HTML என்பது வலையிலிருந்து பதிவிறக்கம் செய்யப்பட்ட மூல HTML ஐ குறிக்கும் யூனிகோட் சரம். HTML பதிவிறக்கம் செய்யப்பட்ட URL என்பது URL ஆகும்.

இந்த முறை * முன் * preprocess_regexps க்கு முன் செயல்படுகிறது என்பதை நினைவில் கொள்க.

இந்த முறை செயலாக்கப்பட்ட RAW_HTML ஐ யூனிகோட் பொருளாக திருப்பித் தர வேண்டும்.

classmethod print_version(url)[source]¶

கட்டுரை உள்ளடக்கத்துடன் வலைப்பக்கத்தை சுட்டிக்காட்டி ஒரு url ஐ எடுத்து, கட்டுரையின் அச்சு பதிப்பை சுட்டிக்காட்டி: கால:` url`. இயல்பாக எதுவும் செய்யாது. உதாரணத்திற்கு:

def print_version(self, url):
    return url + '?&pagewanted=print'

publication_date()[source]¶: இந்த பிரச்சினை வெளியிடப்பட்ட தேதியை அமைக்க இந்த முறையைப் பயன்படுத்தவும். பதிவிறக்கம் செய்யப்பட்ட தருணத்திற்கு இயல்புநிலை. திரும்ப வேண்டும் a: வகுப்பு: datetime.datetime பொருள்.

skip_ad_pages(soup)[source]¶

பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொன்றின் மூலத்துடன் இந்த முறை அழைக்கப்படுகிறது: சொல்: HTML கோப்பு, remate_tags போன்ற எந்தவொரு தூய்மைப்படுத்தும் பண்புகளுக்கும் முன், get_only_tags பயன்படுத்தப்படும். Preprocess_regexps ஏற்கனவே பயன்படுத்தப்பட்டிருக்கும் என்பதை நினைவில் கொள்க. செய்முறையை விளம்பர பக்கங்களைத் தவிர்க்க அனுமதிப்பதாகும். சூப் ஒரு விளம்பரப் பக்கத்தைக் குறிக்கிறது என்றால், உண்மையான பக்கத்தின் HTML ஐத் தரவும். இல்லையெனில் எதுவும் திரும்பவும்.

சூப்: ஒரு` அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> __ பதிவிறக்கம் செய்யப்பட்டுள்ள நிகழ்வு: கால: html.

sort_index_by(index, weights)[source]¶

எடைகள் படி` குறியீட்டில்` தலைப்புகளை வரிசைப்படுத்த வசதி முறை. குறியீட்டு இடத்தில் வரிசைப்படுத்தப்பட்டுள்ளது. குறியீட்டு ஐத் தருகிறது.

குறியீட்டு: தலைப்புகளின் பட்டியல்.

எடைகள்: தலைப்புகளுக்கு எடைகளை வரைபடமாக்கும் அகராதி. குறியீட்டில் ஏதேனும் தலைப்புகள் எடையில் இல்லை என்றால், அவை 0 எடையைக் கொண்டிருப்பதாகக் கருதப்படுகிறது.

classmethod tag_to_string(tag, use_alt=True, normalize_whitespace=True)[source]¶

ஒரு அழகான 3 <https://www.crummic.com/software/beautifulsoup/bs4/doc/> _ _: குறியீடு: குறிச்சொல்` ஆகியவற்றை எடுத்துக்கொள்வதற்கான வசதியான முறை, எந்த சிடா பிரிவுகளும் மற்றும் ஆல்ட் குறிச்சொல் உட்பட அதிலிருந்து மீண்டும் மீண்டும் உரையை பிரித்தெடுக்கவும் பண்புக்கூறுகள். வெற்று யூனிகோட் சரத்தை திருப்பித் தரவும்.

use_alt:` உண்மை` என்றால் எந்த உரை உள்ளடக்கமும் இல்லாத குறிச்சொற்களுக்கு ALT பண்புக்கூறைப் பயன்படுத்த முயற்சிக்கவும்

குறிச்சொல்:` பியூட்டிஃபுல் சப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> _: குறியீடு: குறிச்சொல்`

articles_are_obfuscated = False¶: உண்மை மற்றும் செயல்படுத்தவும்: மெத்: get_obfuscated_article வலைத்தளங்களைக் கையாள உள்ளடக்கத்தை துடைக்க கடினமாக முயற்சிக்கிறது.

auto_cleanup = False¶: பதிவிறக்கம் செய்யப்பட்ட கட்டுரை பக்கங்களிலிருந்து எல்லா உரையையும் தானாகவே பிரித்தெடுக்கவும். வாசிப்பு திட்டத்திலிருந்து வழிமுறைகளைப் பயன்படுத்துகிறது. இதை உண்மையாக அமைத்தல், பதிவிறக்கம் செய்யப்பட்ட HTML ஐ கைமுறையாக சுத்தம் செய்வதைப் பற்றி நீங்கள் கவலைப்பட வேண்டியதில்லை (கையேடு தூய்மைப்படுத்தல் எப்போதும் உயர்ந்ததாக இருக்கும் என்றாலும்).

auto_cleanup_keep = None¶

ஆட்டோ தூய்மைப்படுத்தும் வழிமுறை ஒருபோதும் அகற்றக்கூடாது என்ற கூறுகளைக் குறிப்பிடவும். தொடரியல் ஒரு எக்ஸ்பாத் வெளிப்பாடு. உதாரணத்திற்கு:

auto_cleanup_keep = '//div[@id="article-image"]' will keep all divs with
                                               id="article-image"
auto_cleanup_keep = '//*[@class="important"]' will keep all elements
                                            with class="important"
auto_cleanup_keep = '//div[@id="article-image"]|//span[@class="important"]'
                  will keep all divs with id="article-image" and spans
                  with class="important"

center_navbar = True¶: உண்மை என்றால் வழிசெலுத்தல் பட்டி மையம் சீரமைக்கப்பட்டதாக இருந்தால், இல்லையெனில் அது சீரமைக்கப்படுகிறது

compress_news_images = False¶: அனைத்து அளவிடுதல் மற்றும் சுருக்க அளவுருக்களை புறக்கணிக்க இதை பொய்யாக அமைக்கவும், மாற்றப்படாத மூலம் படங்களை அனுப்பவும். உண்மை மற்றும் பிற சுருக்க அளவுருக்கள் அவற்றின் இயல்புநிலை மதிப்புகளில் விடப்பட்டால், வெளியீட்டு சுயவிவரத்தால் அமைக்கப்பட்ட திரை பரிமாணங்களில் பொருந்தும் வகையில் JPEG படங்கள் அளவிடப்படும் மற்றும் அதிகபட்சமாக (W * H)/16 அளவில் சுருக்கப்படும், அங்கு W x H என்பது அளவிடப்பட்ட பட பரிமாணங்கள் .

compress_news_images_auto_size = 16¶: தானாக அமுக்க JPEG படங்களை பயன்படுத்தும்போது பயன்படுத்தப்படும் காரணி. எதுவுமில்லை என்றால், ஆட்டோ சுருக்கம் முடக்கப்பட்டுள்ளது. இல்லையெனில், படங்கள் (W * H)/சுருக்கம்_நியூஸ்_ஐஎம்ஜேஜ்கள்_ஆட்டோ_சைஸ் பைட்டுகள் தர அளவைக் குறைப்பதன் மூலம் குறைக்கப்படும், அங்கு w x h என்பது பிக்சல்களில் பட பரிமாணங்களாகும். குறைந்தபட்ச JPEG தரம் 5/100 ஆக இருக்கும், எனவே இந்த கட்டுப்பாடு பூர்த்தி செய்யப்படாது. இந்த அளவுருவை சுருக்கம்_நியூஸ்_ஐஎம்ஜேஜ்கள்_மாக்ஸ்_சிஸ் அளவுருவால் மீறலாம், இது படங்களுக்கு நிலையான அதிகபட்ச அளவை வழங்குகிறது. நீங்கள் scale_news_images_to_device ஐ இயக்கினால், படம் முதலில் அளவிடப்படும், பின்னர் அதன் அளவு (W * h)/காரணி குறைவாக இருக்கும் வரை அதன் தரம் குறையும், அங்கு W மற்றும் H இப்போது * அளவிடப்பட்ட * பட பரிமாணங்கள். வேறு வார்த்தைகளில் கூறுவதானால், இந்த சுருக்கம் அளவிடப்பட்ட பிறகு நிகழ்கிறது.

compress_news_images_max_size = None¶: JPEG தரத்தை அமைக்கவும், எனவே படங்கள் கொடுக்கப்பட்ட அளவை விட அதிகமாக இருக்காது (KBytes இல்). அமைக்கப்பட்டால், இந்த அளவுரு தானாக சுருக்கத்தை அமுக்க_நியூஸ்_ஐஎம்ஜேஜ்கள்_ஆட்டோ_சிஸ் வழியாக மேலெழுதும். குறைந்தபட்ச JPEG தரம் 5/100 ஆக இருக்கும், எனவே இந்த கட்டுப்பாடு பூர்த்தி செய்யப்படாது.

conversion_options = {}¶

பதிவிறக்கம் செய்யப்பட்ட உள்ளடக்கத்தை மின் புத்தகமாக மாற்றுவதைக் கட்டுப்படுத்த செய்முறை குறிப்பிட்ட விருப்பங்கள். இவை எந்தவொரு பயனர் அல்லது சொருகி குறிப்பிட்ட மதிப்புகளை மேலெழுதும், எனவே முற்றிலும் தேவைப்பட்டால் மட்டுமே பயன்படுத்தவும். உதாரணத்திற்கு:

conversion_options = {
  'base_font_size'   : 16,
  'linearize_tables' : True,
}

cover_margins = (0, 0, '#ffffff')¶: இயல்பாக, Get_Cover_url () ஆல் வழங்கப்பட்ட அட்டை படம் குறிப்பிட்ட காலத்திற்கான அட்டையாக பயன்படுத்தப்படும். உங்கள் செய்முறையில் இதை மீறுவது பதிவிறக்கம் செய்யப்பட்ட அட்டையை ஒரு சட்டகமாக வழங்குமாறு அறிவுறுத்துகிறது, அதன் அகலமும் உயரமும் பதிவிறக்கம் செய்யப்பட்ட அட்டையின் சதவீதமாக வெளிப்படுத்தப்படுகின்றன. கவர்_மார்கின்ஸ் = (10, 15, '#FFFFFF') இடது மற்றும் வலதுபுறத்தில் ஒரு வெள்ளை விளிம்பு 10px, மேல் மற்றும் கீழ் 15px உடன் கவர். வண்ண பெயர்கள் வரையறுக்கப்பட்டுள்ளன இங்கே <https://www.imagemagick.org/script/color.php> _. சில காரணங்களால், வெள்ளை எப்போதும் விண்டோஸில் வேலை செய்யாது என்பதை நினைவில் கொள்க. அதற்கு பதிலாக #FFFFFF ஐப் பயன்படுத்தவும்

delay = 0¶: நொடிகளில் தொடர்ச்சியான பதிவிறக்கங்களுக்கு இடையிலான இயல்புநிலை தாமதம். வாதம் மிகவும் துல்லியமான நேரத்தைக் குறிக்க மிதக்கும் புள்ளி எண்ணாக இருக்கலாம். காண்க: மெத்: URL தாமதங்களுக்கு செயல்படுத்த get_url_specific_delay.

description = ''¶: உள்ளடக்கத்தை விவரிக்கும் இரண்டு வரிகள் இந்த செய்முறை பதிவிறக்குகிறது. இது முதன்மையாக ஒரு GUI இல் பயன்படுத்தப்படும், இது சமையல் பட்டியலை முன்வைக்கிறது.

encoding = None¶: தவறான சார்ஸெட் விவரக்குறிப்பைக் கொண்ட தளங்களுக்கான மேலெழுதும் குறியாக்கத்தைக் குறிப்பிடவும். `` லத்தீன் 1`` ஐக் குறிப்பிடுவது மிகவும் பொதுவானது மற்றும் `` cp1252`` ஐப் பயன்படுத்துதல். எதுவுமில்லை என்றால், குறியாக்கத்தைக் கண்டறிய முயற்சிக்கவும். இது அழைக்கக்கூடியதாக இருந்தால், அழைக்கக்கூடியது இரண்டு வாதங்களுடன் அழைக்கப்படுகிறது: செய்முறை பொருள் மற்றும் மூலமானது டிகோட் செய்யப்பட வேண்டும். இது டிகோட் செய்யப்பட்ட மூலத்தை திருப்பித் தர வேண்டும்.

extra_css = None¶

பதிவிறக்கம் செய்யப்பட்டவற்றில் சேர்க்கப்பட வேண்டிய கூடுதல்: கால: CSS ஐக் குறிப்பிடவும்: கால:` HTML` கோப்புகள். இது <syle> குறிச்சொற்களில் செருகப்படும், இதன் மூலம் </head> குறிச்சொல் அதன் மூலம் அனைத்தையும் மீறுகிறது: கால: css தனிநபர்: கால: கால:` html` குறிச்சொற்களைப் பயன்படுத்தி அறிவிக்கப்பட்டதைத் தவிர . கூடுதல்_சிஎஸ்எஸ்ஸை மேலெழுதும்: மெத்: get_extra_css () அதற்கு பதிலாக முறை ஆகியவற்றை நீங்கள் நிரல் முறையில் உருவாக்க விரும்பினால் என்பதை நினைவில் கொள்க. உதாரணத்திற்கு:

extra_css = '.heading { font: serif x-large }'

feeds = None¶: பதிவிறக்கம் செய்ய ஊட்டங்களின் பட்டியல். `` [Url1, url2, ...] `` அல்லது (('தலைப்பு 1', url1), ('தலைப்பு 2', url2), ...] `

filter_regexps = []¶

புறக்கணிக்க எந்த இணைப்புகளை தீர்மானிக்கும் வழக்கமான வெளிப்பாடுகளின் பட்டியல். காலியாக இருந்தால் அது புறக்கணிக்கப்படுகிறது. IS_link_wanted செயல்படுத்தப்படாவிட்டால் மட்டுமே பயன்படுத்தப்படுகிறது. உதாரணத்திற்கு:

filter_regexps = [r'ads\.doubleclick\.net']

விளம்பரங்கள். DoubleClick.net கொண்ட அனைத்து URL களையும் அகற்றும்.

ஒன்று மட்டுமே: ATTR: BasicNewsRecipe.match_regexps அல்லது: attr:` BasicNewsRecipe.filter_regexps` வரையறுக்கப்பட வேண்டும்.

handle_gzip = True¶: நீங்கள் gziped இடமாற்றங்களைப் பயன்படுத்த விரும்பவில்லை என்றால் பொய்யாக அமைக்கவும். சில பழைய சேவையகங்கள் GZIP உடன் வெளியேறுகின்றன என்பதை நினைவில் கொள்க

ignore_duplicate_articles = None¶

ஒன்றுக்கு மேற்பட்ட பிரிவுகளில் இருக்கும் கட்டுரைகளின் நகல்களைப் புறக்கணிக்கவும். ஒரு நகல் கட்டுரை என்பது ஒரே தலைப்பு மற்றும்/அல்லது URL ஐக் கொண்ட ஒரு கட்டுரை. அதே தலைப்பைக் கொண்ட கட்டுரைகளை புறக்கணிக்க, இதை அமைக்கவும்

ignore_duplicate_articles = {'title'}

அதற்கு பதிலாக URL களைப் பயன்படுத்த, அதை அமைக்கவும்

ignore_duplicate_articles = {'url'}

தலைப்பு அல்லது URL இல் பொருத்த, அதை அமைக்கவும்

ignore_duplicate_articles = {'title', 'url'}

keep_only_tags = []¶

குறிப்பிட்ட குறிச்சொற்களையும் அவர்களின் குழந்தைகளையும் மட்டுமே வைத்திருங்கள். ஒரு குறிச்சொல்லைக் குறிப்பிடுவதற்கான வடிவமைப்பிற்கு: Attr: BasicNewsRecipe.Remove_tags. இந்த பட்டியல் காலியாக இல்லாவிட்டால், இந்த பட்டியலில் உள்ள உள்ளீடுகளுடன் பொருந்தக்கூடிய குறிச்சொற்களுடன் <உடல்> குறிச்சொல் காலியாகி மீண்டும் நிரப்பப்படும். உதாரணத்திற்கு:

keep_only_tags = [dict(id=['content', 'heading'])]

" உள்ளடக்கம் " அல்லது தலைப்பு" ` ஐடி` பண்புக்கூறு கொண்ட குறிச்சொற்களை மட்டுமே வைத்திருக்கும்.

language = 'und'¶: செய்தி இருக்கும் மொழி. இரண்டு அல்லது மூன்று எழுத்துக்கள் நீளமாக ஐஎஸ்ஓ -639 குறியீடாக இருக்க வேண்டும்

masthead_url = None¶: இயல்பாக, காலிபர் மாஸ்ட்ஹெட் (கின்டெல் மட்டும்) இயல்புநிலை படத்தைப் பயன்படுத்தும். உங்கள் செய்முறையில் இதை மீறுங்கள்.

match_regexps = []¶

எந்த இணைப்புகளைப் பின்பற்ற வேண்டும் என்பதை தீர்மானிக்கும் வழக்கமான வெளிப்பாடுகளின் பட்டியல். காலியாக இருந்தால், அது புறக்கணிக்கப்படுகிறது. IS_link_wanted செயல்படுத்தப்படாவிட்டால் மட்டுமே பயன்படுத்தப்படுகிறது. உதாரணத்திற்கு:

match_regexps = [r'page=[0-9]+']

அவற்றில் பக்கம் = சில எண் கொண்ட அனைத்து URL களையும் பொருத்தும்.

ஒன்று மட்டுமே: ATTR: BasicNewsRecipe.match_regexps அல்லது: attr:` BasicNewsRecipe.filter_regexps` வரையறுக்கப்பட வேண்டும்.

max_articles_per_feed = 100¶: ஒவ்வொரு ஊட்டத்திலிருந்தும் பதிவிறக்கம் செய்ய அதிகபட்ச கட்டுரைகள். கட்டுரை தேதிகள் இல்லாத ஊட்டங்களுக்கு இது முதன்மையாக பயனுள்ளதாக இருக்கும். பெரும்பாலான ஊட்டங்களுக்கு, நீங்கள் பயன்படுத்த வேண்டும்: ATTR: BasicNewsRecipe.oldest_article

needs_subscription = False¶: உண்மை என்றால் GUI பயனருக்கு பயனர்பெயர் மற்றும் கடவுச்சொல்லை பதிவிறக்கும் போது பயன்படுத்துமாறு கேட்கும். "விரும்பினால்" என அமைக்கப்பட்டால், பயனர்பெயர் மற்றும் கடவுச்சொல்லின் பயன்பாடு விருப்பமாகிறது

no_stylesheets = False¶: மின்-புத்தக வடிவங்களுக்கு மாற்றுவதற்கு பொருத்தமற்ற அதிகப்படியான சிக்கலான ஸ்டைல்ஷீட்களைக் கொண்ட வலைத்தளங்களுக்கான ஸ்டைல்ஷீட்களை ஏற்றுவதை முடக்க வசதியான கொடி. உண்மையான ஸ்டைல்ஷீட்கள் பதிவிறக்கம் செய்யப்பட்டு செயலாக்கப்படாவிட்டால்

oldest_article = 7.0¶: இந்த செய்தி மூலத்திலிருந்து பதிவிறக்கம் செய்ய பழமையான கட்டுரை. நாட்களில்.

preprocess_regexps = []¶

பட்டியல்: கால: REGEXP பதிவிறக்கம் செய்யப்பட்டவற்றில் இயக்க மாற்று விதிகள்: கால:` html`. பட்டியலின் ஒவ்வொரு உறுப்புகளும் இரண்டு உறுப்பு டப்பிள் ஆக இருக்க வேண்டும். டூப்பிளின் முதல் உறுப்பு தொகுக்கப்பட்ட வழக்கமான வெளிப்பாடாக இருக்க வேண்டும், மேலும் இரண்டாவது ஒரு மேட்ச் பொருளை எடுத்து போட்டியை மாற்றுவதற்கு ஒரு சரத்தை வழங்குகிறது. உதாரணத்திற்கு:

preprocess_regexps = [
   (re.compile(r'<!--Article ends here-->.*</body>', re.DOTALL|re.IGNORECASE),
    lambda match: '</body>'),
]

<!-கட்டுரை இங்கே முடிவடைகிறது-> </body> `வரை அனைத்தையும் அகற்றும்.

publication_type = 'unknown'¶: வெளியீட்டு வகை செய்தித்தாள், பத்திரிகை அல்லது வலைப்பதிவில் அமைக்கப்பட்டுள்ளது. எதுவுமில்லை என்றால், எந்த வெளியீட்டு வகை மெட்டாடேட்டா OPF கோப்பில் எழுதப்படாது.

recipe_disabled = None¶: இந்த செய்முறையை முடக்க வெற்று அல்லாத சரத்திற்கு அமைக்கவும். சரம் முடக்கப்பட்ட செய்தியாக பயன்படுத்தப்படும்

recursions = 0¶: கட்டுரை வலைப்பக்கங்களில் பின்பற்ற வேண்டிய இணைப்புகளின் நிலைகளின் எண்ணிக்கை

remove_attributes = []¶

எல்லா குறிச்சொற்களிலிருந்தும் அகற்ற வேண்டிய பண்புகளின் பட்டியல். உதாரணத்திற்கு:

remove_attributes = ['style', 'font']

remove_empty_feeds = False¶: உண்மையான வெற்று ஊட்டங்கள் வெளியீட்டிலிருந்து அகற்றப்பட்டால். துணை வகுப்பில் parse_index ஐ மீறினால் இந்த விருப்பம் எந்த விளைவையும் ஏற்படுத்தாது. ஊட்டங்கள் அல்லது: மெத்:` get_feeds` ஐப் பயன்படுத்தி ஊட்டங்களின் பட்டியலைத் தரும் சமையல் குறிப்புகளுக்கு மட்டுமே இது. நீங்கள் புறக்கணிப்பு_டூஃபிகேட்_ஆர்டிகல்ஸ் விருப்பத்தைப் பயன்படுத்தினால் இது பயன்படுத்தப்படுகிறது.

remove_javascript = True¶: பதிவிறக்கம் செய்யப்பட்ட HTML இலிருந்து அனைத்து ஜாவாஸ்கிரிப்ட் குறிச்சொற்களையும் அகற்ற வசதியான கொடி

remove_tags = []¶

அகற்றப்பட வேண்டிய குறிச்சொற்களின் பட்டியல். குறிப்பிடப்பட்ட குறிச்சொற்கள் பதிவிறக்கம் செய்யப்பட்ட HTML இலிருந்து அகற்றப்படுகின்றன. ஒரு குறிச்சொல் படிவத்தின் அகராதியாக குறிப்பிடப்பட்டுள்ளது

{
 name      : 'tag name',   #e.g. 'div'
 attrs     : a dictionary, #e.g. {'class': 'advertisment'}
}

எல்லா விசைகளும் விருப்பமானவை. தேடல் அளவுகோல்களின் முழு விளக்கத்திற்கு, அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/#searching-the-tree> __ ஒரு பொதுவான எடுத்துக்காட்டு

remove_tags = [dict(name='div', class_='advert')]

இது அனைத்து <div class =" விளம்பரம் "> குறிச்சொற்களையும் அவர்களின் அனைத்து குழந்தைகளையும் பதிவிறக்கம் செய்யப்பட்டவற்றிலிருந்து அகற்றும்: கால: html.

remove_tags_after = None¶

குறிப்பிட்ட குறிச்சொல்லுக்குப் பிறகு ஏற்படும் அனைத்து குறிச்சொற்களையும் அகற்றவும். ஒரு குறிச்சொல்லைக் குறிப்பிடுவதற்கான வடிவமைப்பிற்கு: Attr: BasicNewsRecipe.Remove_tags. உதாரணத்திற்கு:

remove_tags_after = [dict(id='content')]

முதல் உறுப்புக்குப் பிறகு அனைத்து குறிச்சொற்களையும் ஐடி =" உள்ளடக்கம் " `அகற்றும்.

remove_tags_before = None¶

குறிப்பிட்ட குறிச்சொல்லுக்கு முன் நிகழும் அனைத்து குறிச்சொற்களையும் அகற்று. ஒரு குறிச்சொல்லைக் குறிப்பிடுவதற்கான வடிவமைப்பிற்கு: Attr: BasicNewsRecipe.Remove_tags. உதாரணத்திற்கு:

remove_tags_before = dict(id='content')

முதல் உறுப்புக்கு முன் ஐடி =" உள்ளடக்கம் " `உடன் எல்லா குறிச்சொற்களையும் அகற்றும்.

requires_version = (0, 6, 0)¶: இந்த செய்முறையைப் பயன்படுத்த குறைந்தபட்ச காலிபர் பதிப்பு தேவை

resolve_internal_links = False¶: உண்மை என அமைக்கப்பட்டால், பதிவிறக்கம் செய்யப்பட்ட கட்டுரைகளில் உள்ள இணைப்புகள் பதிவிறக்கம் செய்யப்பட்ட பிற கட்டுரைகளை சுட்டிக்காட்டுகின்றன, அதன் அசல் வலை URL ஐ விட கட்டுரையின் பதிவிறக்கம் செய்யப்பட்ட நகலை சுட்டிக்காட்டுகின்றன. இதை நீங்கள் உண்மையாக அமைத்தால், நீங்கள் செயல்படுத்த வேண்டியிருக்கலாம்: மெத்: உங்கள் குறிப்பிட்ட வலைத்தளத்தின் URL திட்டத்துடன் பணியாற்ற canonicalize_internal_url.

reverse_article_order = False¶: ஒவ்வொரு ஊட்டத்திலும் கட்டுரைகளின் வரிசையை மாற்றியமைக்கவும்

scale_news_images = None¶: படங்களை அளவிட அதிகபட்ச பரிமாணங்கள் (W, H). SCALE_NEWS_IMAGES_TO_DEVICE உண்மை என்றால், இது சுயவிவரத் தொகுப்பு எதுவும் இல்லாவிட்டால் வெளியீட்டு சுயவிவரத்தால் அமைக்கப்பட்ட சாதனத் திரை பரிமாணங்களுக்கு அமைக்கப்பட்டுள்ளது, இந்த விஷயத்தில் அது ஒதுக்கப்பட்ட எந்த மதிப்பிலும் (இயல்புநிலை எதுவுமில்லை) விடப்படுகிறது.

scale_news_images_to_device = True¶: வெளியீட்டு சுயவிவரத்தால் அமைக்கப்பட்ட சாதனத் திரை பரிமாணங்களில் பொருந்தக்கூடிய படங்களை மீட்டெடுக்கவும். வெளியீட்டு சுயவிவரம் அமைக்கப்படாவிட்டால் புறக்கணிக்கப்படுகிறது.

simultaneous_downloads = 5¶: ஒரே நேரத்தில் பதிவிறக்கங்களின் எண்ணிக்கை. சேவையகம் சேகரிப்பதாக இருந்தால் 1 ஆக அமைக்கவும். தானாகவே 1 எனக் குறைக்கப்படுகிறது: ATTR: BasicNewsRecipe.Delay> 0

summary_length = 500¶: குறுகிய விளக்கத்தில் அதிகபட்ச எழுத்துக்களின் எண்ணிக்கை

template_css = '\n .article_date {\n color: gray; font-family: monospace;\n }\n\n .article_description {\n text-indent: 0pt;\n }\n\n a.article {\n font-weight: bold; text-align:left;\n }\n\n a.feed {\n font-weight: bold;\n }\n\n .calibre_navbar {\n font-family:monospace;\n }\n '¶: வார்ப்புருக்கள், அதாவது, வழிசெலுத்தல் பார்கள் மற்றும் உள்ளடக்கங்களின் அட்டவணைகள் ஆகியவற்றை பாணி செய்யப் பயன்படும் CSS. இந்த மாறியை மீறுவதற்குப் பதிலாக, தோற்றத்தையும் உணர்வையும் தனிப்பயனாக்க உங்கள் செய்முறையில் `கூடுதல்_சிஎஸ்ஸைப் பயன்படுத்த வேண்டும்.

timefmt = ' [%a, %d %b %Y]'¶: முதல் பக்கத்தில் காட்டப்பட்டுள்ள தேதிக்கான வடிவமைப்பு சரம். இயல்பாக: day_name, day_number monthy_name ஆண்டு

timeout = 120.0¶: சேவையகத்திலிருந்து கோப்புகளை நொடிகளில் பெறுவதற்கான நேரம் முடிந்தது

title = 'தெரியாத செய்தி ஆதாரம்'¶: மின் புத்தகத்திற்கு பயன்படுத்த வேண்டிய தலைப்பு

use_embedded_content = None¶: உட்பொதிக்கப்பட்ட உள்ளடக்கத்தின் நீளத்தின் அடிப்படையில் ஒரு ஊட்டத்தில் முழு கட்டுரைகள் பதிக்கப்பட்டுள்ளனவா என்று பொதுவாக யூகிக்க முயற்சிக்கிறோம். எதுவுமில்லை 'என்றால், இயல்புநிலை யூகம் பயன்படுத்தப்படுகிறது. `உண்மை என்றால், ஊட்டங்கள் உள்ளடக்கத்தை உட்பொதித்ததாக நாங்கள் எப்போதும் கருதுகிறோம்,` பொய் 'என்றால், தீவனத்தில் உட்பொதிக்கப்பட்ட உள்ளடக்கம் இல்லை என்று நாங்கள் எப்போதும் கருதுகிறோம்.