சமையல் குறிப்புகளுக்கான ஏபிஐ ஆவணங்கள்¶
சமையல் எழுதுவதற்கான ஏபிஐ வரையறுக்கப்படுகிறது: வகுப்பு: அடிப்படை நியூஸ்ரெசிப்
- class calibre.web.feeds.news.BasicNewsRecipe(options, log, progress_reporter)[source]¶
அனைத்து சமையல் குறிப்புகளிலும் தேவையான தர்க்கத்தைக் கொண்ட அடிப்படை வகுப்பு. இந்த வகுப்பில் படிப்படியாக அதிக செயல்பாட்டை மீறுவதன் மூலம், நீங்கள் படிப்படியாக மேலும் தனிப்பயனாக்கப்பட்ட/சக்திவாய்ந்த சமையல் வகைகளை உருவாக்கலாம். சமையல் குறிப்புகளை உருவாக்குவதற்கான ஒரு பயிற்சி அறிமுகத்திற்கு, காண்க: டாக்: செய்தி.
- abort_article(msg=None)[source]¶
தற்போதைய கட்டுரைக்கான பதிவிறக்கத்தை நிறுத்துவதற்கு எந்தவொரு முன் செயலாக்க முறைகளிலும் இந்த முறையை அழைக்கவும். தூய வீடியோ கட்டுரைகள் போன்ற பொருத்தமற்ற உள்ளடக்கத்தைக் கொண்ட கட்டுரைகளைத் தவிர்க்க பயனுள்ளதாக இருக்கும்.
- abort_recipe_processing(msg)[source]¶
ரெசிபி பதிவிறக்க முறை இந்த செய்முறையின் பதிவிறக்கத்தை நிறுத்தி, பயனருக்கு எளிய பின்னூட்ட செய்தியைக் காண்பிக்கும்.
- add_toc_thumbnail(article, src)[source]¶
உள்ளடக்க அட்டவணையில் உள்ள கட்டுரையை குறிக்கும் சிறுபடமாக பயன்படுத்த பொருத்தமான கட்டுரையிலிருந்து <img> குறிச்சொல்லின் எஸ்.ஆர்.சி பண்புக்கூறுடன் இதை மக்கள் தொகை_ஆர்டிகல்_மெட்டாடேட்டாவிலிருந்து அழைக்கவும். சிறுபடம் உண்மையில் பயன்படுத்தப்படுகிறதா என்பது சாதனத்தை சார்ந்தது (தற்போது கின்டில்ஸால் மட்டுமே பயன்படுத்தப்படுகிறது). குறிப்பிடப்பட்ட படம் வெற்றிகரமாக பதிவிறக்கம் செய்யப்பட்ட ஒன்றாக இருக்க வேண்டும் என்பதை நினைவில் கொள்க, இல்லையெனில் அது புறக்கணிக்கப்படும்.
- classmethod adeify_images(soup)[source]¶
அடோப் டிஜிட்டல் பதிப்புகளில் பார்க்கும்போது உங்கள் செய்முறைக்கு EPUB ஆக மாற்றும்போது படங்களுடன் சிக்கல்கள் இருந்தால், இந்த முறையை உள்ளே இருந்து அழைக்கவும்: மெத்: `போஸ்ட்ரோசஸ்_ஹெச்.டி.எம்.எல்.
- canonicalize_internal_url(url, is_link=True)[source]¶
`` Url`` இன் நியமன பிரதிநிதித்துவங்களின் தொகுப்பைத் தரவும். இயல்புநிலை செயல்படுத்தல் எந்தவொரு வினவல் அளவுருக்கள், துண்டுகள் போன்றவற்றைப் புறக்கணித்து, சேவையக ஹோஸ்ட்பெயர் மற்றும் URL இன் பாதையைப் பயன்படுத்துகிறது. இந்த செய்தி மூலத்திற்கான அனைத்து URL களிலும் நியமன பிரதிநிதித்துவங்கள் தனித்துவமாக இருக்க வேண்டும். அவை இல்லையென்றால், உள் இணைப்புகள் தவறாக தீர்க்கப்படலாம்.
- அளவுருக்கள்:
is_link -- HTML கோப்பில் உள்ள உள் இணைப்பிலிருந்து URL வந்தால் உண்மை. ஒரு கட்டுரையைப் பதிவிறக்குவதற்கு URL என்பது URL என்றால் தவறு.
- cleanup()[source]¶
எல்லா கட்டுரைகளும் பதிவிறக்கம் செய்யப்பட்ட பிறகு அழைக்கப்பட்டன. சந்தா தளங்கள் போன்றவற்றிலிருந்து வெளியேறுவது போன்ற எந்த தூய்மைப்படுத்தலையும் செய்ய இதைப் பயன்படுத்தவும்.
- clone_browser(br)[source]¶
உலாவியை குளோன் செய்யுங்கள் br. குளோன் செய்யப்பட்ட உலாவிகள் பல திரிக்கப்பட்ட பதிவிறக்கங்களுக்கு பயன்படுத்தப்படுகின்றன, ஏனெனில் இயந்திரமயமாக்கல் நூல் பாதுகாப்பானது அல்ல. இயல்புநிலை குளோனிங் நடைமுறைகள் பெரும்பாலான உலாவி தனிப்பயனாக்கத்தைக் கைப்பற்ற வேண்டும், ஆனால் உங்கள் செய்முறையில் நீங்கள் கவர்ச்சியான ஏதாவது செய்தால், உங்கள் செய்முறையிலும், குளோனிலும் இந்த முறையை கைமுறையாக மீற வேண்டும்.
குக்கீ கையாளுதலைத் தனிப்பயனாக்காவிட்டால், குளோன் செய்யப்பட்ட உலாவி நிகழ்வுகள் இயல்பாகவே, நூல்-பாதுகாப்பான குக்கீஜாரைப் பயன்படுத்துகின்றன.
- download()[source]¶
இந்த செய்முறையில் உள்ள ஊட்டங்களிலிருந்து அனைத்து கட்டுரைகளையும் பதிவிறக்கம் செய்து முன் செயலாக்குங்கள். இந்த முறையை ஒரு குறிப்பிட்ட செய்முறை நிகழ்வில் ஒரு முறை மட்டுமே அழைக்க வேண்டும். இதை ஒன்றுக்கு மேற்பட்ட முறை அழைப்பது வரையறுக்கப்படாத நடத்தைக்கு வழிவகுக்கும். : திரும்ப: குறியீட்டுக்கான பாதை. Html
- extract_readable_article(html, url)[source]¶
'HTML' இலிருந்து முக்கிய கட்டுரை உள்ளடக்கத்தை பிரித்தெடுக்கிறது, சுத்தப்படுத்தி (கட்டுரை_ஹெச்.டி.எம்.எல், பிரித்தெடுக்கப்பட்ட_டிடில்) டப்பிள் என திரும்பும். ARC90 ஆல் அசல் வாசிப்பு வழிமுறையின் அடிப்படையில்.
- get_article_url(article)[source]¶
ஒவ்வொரு கட்டுரைக்கும் உள்ளடக்கத்தை சுட்டிக்காட்டும்: கால: url இன் பிரித்தெடுத்தலைத் தனிப்பயனாக்க ஒரு துணைப்பிரிவில் மேலெழுதவும். கட்டுரை URL ஐ திருப்பி விடுங்கள். இது கட்டுரை என்று அழைக்கப்படுகிறது, இது ஒரு ஊட்டத்திலிருந்து ஒரு பாகுபடுத்தப்பட்ட கட்டுரையை குறிக்கும். Feedparser <https://pythonhosted.org/feedparser/> _ ஐப் பார்க்கவும். முன்னிருப்பாக இது அசல் இணைப்பைத் தேடுகிறது (ஃபீட்பர்னர் அல்லது ஃபீடோ போன்ற ஒரு சேவையின் வழியாக ஒத்திசைக்கப்படும் ஊட்டங்களுக்கு) மற்றும் கண்டுபிடிக்கப்பட்டால், அதைத் தருகிறது அல்லது `கட்டுரையை அளிக்கிறது. html> `_.
- get_browser(*args, **kwargs)[source]¶
வலையிலிருந்து ஆவணங்களைப் பெற பயன்படும் உலாவி உதாரணத்தைத் தரவும். இயல்பாக இது இயந்திரமயமாக்கல் <https://mechanize.readthedocs.io/en/latest/> _ _ _ _ குக்கீகளை ஆதரிக்கும், ரோபோக்களை புறக்கணிக்கிறது, புதுப்பிப்புகளை கையாளுகிறது மற்றும் மொஸில்லா பயனர் பயனர் முகவரைக் கொண்டுள்ளது.
உங்கள் செய்முறைக்கு நீங்கள் முதலில் உள்நுழைய வேண்டும் என்றால், உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுதவும். எடுத்துக்காட்டாக, முழு அணுகலுக்காக உள்நுழைய நியூயார்க் டைம்ஸ் செய்முறையில் பின்வரும் குறியீடு பயன்படுத்தப்படுகிறது
def get_browser(self): br = BasicNewsRecipe.get_browser(self) if self.username is not None and self.password is not None: br.open('https://www.nytimes.com/auth/login') br.select_form(name='login') br['USERID'] = self.username br['PASSWORD'] = self.password br.submit() return br
- get_cover_url()[source]¶
திரும்பவும் ஒரு: கால: url இந்த சிக்கலுக்கான கவர் படத்திற்கு அல்லது` எதுவுமில்லை '. இயல்பாக இது உறுப்பினரின் self.cover_url இன் மதிப்பை வழங்குகிறது, இது பொதுவாக` எதுவுமில்லை. உங்கள் செய்முறையானது உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுதும் மின் புத்தகத்திற்கான ஒரு அட்டையை பதிவிறக்கம் செய்ய விரும்பினால், அல்லது இந்த முறை அழைக்கப்படுவதற்கு முன்பு உறுப்பினர் மாறியை self.cover_url ஐ அமைக்கவும்.
- get_extra_css()[source]¶
இயல்பாக self.extra_css ஐ வழங்குகிறது. மேலெழுதவும் நீங்கள் கூடுதல்_சிஎஸ்ஸை நிரல் முறையில் உருவாக்க விரும்பினால்.
- get_feeds()[source]¶
இந்த சுயவிவரத்தைப் பெற rss ஊட்டங்கள். பட்டியலின் ஒவ்வொரு உறுப்புகளும் படிவத்தின் 2-உறுப்பு டூப்பலாக இருக்க வேண்டும் (தலைப்பு, URL). தலைப்பு எதுவுமில்லை அல்லது வெற்று சரம் என்றால், ஊட்டத்திலிருந்து தலைப்பு பயன்படுத்தப்படுகிறது. பதிவிறக்கம் செய்ய ஊட்டங்களின் பட்டியலைக் கண்டுபிடிக்க உங்கள் செய்முறை சில செயலாக்கங்களைச் செய்ய வேண்டுமானால் இந்த முறை பயனுள்ளதாக இருக்கும். அப்படியானால், உங்கள் துணைப்பிரிவில் மேலெழுதவும்.
- get_masthead_title()[source]¶
செய்முறை தலைப்பைத் தவிர வேறு ஒன்றைப் பயன்படுத்த துணைப்பிரிவில் மேலெழுதவும்
- get_masthead_url()[source]¶
திரும்பவும் ஒரு: கால: url இந்த சிக்கலுக்காக மாஸ்ட்ஹெட் படத்திற்கு அல்லது` எதுவுமில்லை '. இயல்பாக இது உறுப்பினரின் self.masthead_url இன் மதிப்பை வழங்குகிறது, இது பொதுவாக` எதுவுமில்லை. உங்கள் செய்முறையை மின் புத்தகத்திற்கான ஒரு மாஸ்ட்ஹெட்டை பதிவிறக்கம் செய்ய விரும்பினால், இந்த முறையை உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுத வேண்டும், அல்லது இந்த முறை அழைக்கப்படுவதற்கு முன்பு உறுப்பினர் மாறியை `சுய. மாஸ்ட்ஹெட் படங்கள் கின்டெல் மொபி கோப்புகளில் பயன்படுத்தப்படுகின்றன.
- get_obfuscated_article(url)[source]¶
நீங்கள் articles_are_obfuscated ஐ அமைத்தால் இந்த முறை ஒவ்வொரு கட்டுரை URL க்கும் அழைக்கப்படுகிறது. இது HTML கட்டுரையைக் கொண்ட கோப்பு முறைமையில் ஒரு கோப்பிற்கு பாதையை திருப்பித் தர வேண்டும். அந்த கோப்பு சுழல்நிலை HTML பெறுதல் இயந்திரத்தால் செயலாக்கப்படுகிறது, எனவே இது வலையில் பக்கங்கள்/படங்களுக்கான இணைப்புகளைக் கொண்டிருக்கலாம். மாற்றாக, நீங்கள் படிவத்தின் அகராதியை திருப்பித் தரலாம்: {'தரவு': <html தரவு>, 'url': <கட்டுரையின் தீர்க்கப்பட்ட URL>}. இது தற்காலிக கோப்புகளை உருவாக்கத் தவிர்க்கிறது. கட்டுரையின் பயனுள்ள URL இந்த முறைக்கு அனுப்பப்பட்ட URL இலிருந்து வேறுபட்டால், அகராதியில் உள்ள url விசை பயனுள்ளதாக இருக்கும், எடுத்துக்காட்டாக, வழிமாற்றுகள் காரணமாக. URL மாறாமல் இருந்தால் அதை தவிர்க்கலாம்.
கட்டுரை உள்ளடக்கத்தை தானாக அணுகுவதை கடினமாக்க முயற்சிக்கும் தளங்களுக்கு இந்த முறை பொதுவாக பயனுள்ளதாக இருக்கும்.
- get_url_specific_delay(url)[source]¶
இந்த URL ஐ பதிவிறக்குவதற்கு முன் விநாடிகளில் தாமதத்தைத் தரவும். குறிப்பிட்ட URL க்கான தாமதத்தை நீங்கள் நிரல் ரீதியாக தீர்மானிக்க விரும்பினால், உங்கள் துணைப்பிரிவில் இந்த முறையை மேலெழுதவும், நீங்கள் பாதிக்க விரும்பாத URL களுக்கு இயல்புநிலையாக சுய.
- வருமானம்:
ஒரு மிதக்கும் புள்ளி எண், விநாடிகளின் தாமதம்.
- classmethod image_url_processor(baseurl, url)[source]¶
பட URL களில் சில செயலாக்கத்தைச் செய்யுங்கள் (ஒருவேளை மாறும் வகையில் உருவாக்கப்பட்ட படங்களுக்கான அளவு கட்டுப்பாடுகளை நீக்குகிறது) மற்றும் முன்னோடி URL ஐத் தரவும். படத்தைப் பெறுவதைத் தவிர்க்க எதுவும் அல்லது வெற்று சரம் திரும்பவும்.
- index_to_soup(url_or_raw, raw=False, as_tree=False, save_raw=None)[source]¶
குறியீட்டு பக்கத்திற்கு ஒரு URL ஐ எடுத்து `பியூட்டிஃபுல் சப்பை <https://www.crummic.com/software/beautifulsoup/bs4/doc> __ __.
url_or_raw: ஒரு URL அல்லது பதிவிறக்கம் செய்யப்பட்ட குறியீட்டு பக்கத்தை ஒரு சரமாக
- is_link_wanted(url, tag)[source]¶
இணைப்பைப் பின்பற்ற வேண்டும் அல்லது இல்லையெனில் தவறானது என்றால் உண்மையாக திரும்பவும். இயல்பாக, NOTIMPLEMENTEDERROR ஐ உயர்த்துகிறது, இது பதிவிறக்கத்தை புறக்கணிக்க காரணமாகிறது.
- அளவுருக்கள்:
url -- பின்பற்றப்பட வேண்டிய URL
tag -- URL எந்த குறிச்சொல் பெறப்பட்டது
- parse_feeds()[source]¶
திரும்பிய ஊட்டங்களின் பட்டியலிலிருந்து கட்டுரைகளின் பட்டியலை உருவாக்கவும்: மெத்: BasicNewsRecipe.get_feeds. ஒரு பட்டியலைத் தரவும்: வகுப்பு: ஊட்டம் பொருள்கள்.
- parse_index()[source]¶
கட்டுரைகளின் பட்டியலை உருவாக்க ஊட்டங்களுக்கு பதிலாக ஒரு வலைத்தளத்தை அலசும் சமையல் குறிப்புகளில் இந்த முறை செயல்படுத்தப்பட வேண்டும். தற்போதைய அச்சு பதிப்பில் உள்ள அனைத்து கட்டுரைகளையும் பட்டியலிடும் "அச்சு பதிப்பு" வலைப்பக்கத்தைக் கொண்ட செய்தி ஆதாரங்களுக்கான வழக்கமான பயன்பாடுகள். இந்த செயல்பாடு செயல்படுத்தப்பட்டால், அது முன்னுரிமை அளிக்கப்படும்: METH: BasicNewsRecipe.Parse_feeds.
அது ஒரு பட்டியலைத் திருப்பித் தர வேண்டும். பட்டியலின் ஒவ்வொரு உறுப்புகளும் `` ('ஊட்ட தலைப்பு', கட்டுரைகளின் பட்டியல்) `` வடிவத்தின் 2-உறுப்பு டூப்பலாக இருக்க வேண்டும்.
கட்டுரைகளின் ஒவ்வொரு பட்டியலிலும் படிவத்தின் அகராதிகள் இருக்க வேண்டும்
{ 'title' : article title, 'url' : URL of print version, 'date' : The publication date of the article as a string, 'description' : A summary of the article 'content' : The full article (can be an empty string). Obsolete do not use, instead save the content to a temporary file and pass a file:///path/to/temp/file.html as the URL. }
எடுத்துக்காட்டுக்கு, அட்லாண்டிக் பதிவிறக்குவதற்கான செய்முறையைப் பார்க்கவும். கூடுதலாக, கட்டுரையின் ஆசிரியருக்கு 'எழுத்தாளரை' சேர்க்கலாம்.
நீங்கள் சில காரணங்களால் செயலாக்கத்தை நிறுத்த விரும்பினால், பிழைக்கு பதிலாக பயனருக்கு ஒரு எளிய செய்தியைக் காட்டினால், அழைக்கவும்: மெத்: abort_recipe_processing.
- populate_article_metadata(article, soup, first)[source]¶
கட்டுரைக்கு சொந்தமான ஒவ்வொரு HTML பக்கமும் பதிவிறக்கம் செய்யப்படும் போது அழைக்கப்படுகிறது. ஆசிரியர்/சுருக்கம்/போன்ற கட்டுரை மெட்டாடேட்டாவைப் பெற பயன்படுத்தப்பட வேண்டும். பாகுபடுத்தப்பட்ட HTML (சூப்) இலிருந்து.
- அளவுருக்கள்:
article -- வகுப்பின் ஒரு பொருள்: வகுப்பு: calibre.web.feeds.article. நீங்கள் சுருக்கத்தை மாற்றினால், உரையை மாற்றவும் நினைவில் கொள்ளுங்கள்
soup -- இந்த கட்டுரையைச் சேர்ந்த பாகுபடுத்தப்பட்ட HTML
first -- உண்மை iff பாகுபடுத்தப்பட்ட HTML என்பது கட்டுரையின் முதல் பக்கம்.
- postprocess_book(oeb, opts, log)[source]¶
பாகுபடுத்தப்பட்ட பதிவிறக்கம் செய்யப்பட்ட மின் புத்தகத்தில் தேவையான இடுகை செயலாக்கத்தை இயக்கவும்.
- அளவுருக்கள்:
oeb -- ஒரு OEBBOOK பொருள்
opts -- மாற்று விருப்பங்கள்
- postprocess_html(soup, first_fetch)[source]¶
பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு மூலத்துடனும் இந்த முறை அழைக்கப்படுகிறது: கால: HTML கோப்பு, இது இணைப்புகள் மற்றும் படங்களுக்காக பாகுபடுத்தப்பட்ட பிறகு. : கால: html இல் தன்னிச்சையாக சக்திவாய்ந்த பிந்தைய செயலாக்கத்தை செய்ய இதைப் பயன்படுத்தலாம். அதை செயலாக்கிய பிறகு அது சூப் திரும்ப வேண்டும்.
- அளவுருக்கள்:
soup -- ஒரு அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> __ பதிவிறக்கம் செய்யப்பட்டுள்ள நிகழ்வு: கால: html`.
first_fetch -- இது ஒரு கட்டுரையின் முதல் பக்கம் என்றால் உண்மை.
- preprocess_html(soup)[source]¶
பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு மூலத்துடனும் இந்த முறை அழைக்கப்படுகிறது: கால: html கோப்பு, இது இணைப்புகள் மற்றும் படங்களுக்கு பாகுபடுத்தப்படுவதற்கு முன்பு. Remove_Tags போன்றவற்றால் குறிப்பிடப்பட்டுள்ளபடி இது தூய்மைப்படுத்தலுக்குப் பிறகு அழைக்கப்படுகிறது. இது தன்னிச்சையாக சக்திவாய்ந்த முன் செயலாக்கத்தை செய்ய பயன்படுத்தப்படலாம்: கால: html. அதை செயலாக்கிய பிறகு அது சூப் திரும்ப வேண்டும்.
சூப்: ஒரு` அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> __ பதிவிறக்கம் செய்யப்பட்டுள்ள நிகழ்வு: கால: html.
- preprocess_image(img_data, image_url)[source]¶
பதிவிறக்கம் செய்யப்பட்ட படத் தரவில் சில செயலாக்கத்தைச் செய்யுங்கள். எந்தவொரு மறுஅளவிடுதலும் செய்யப்படுவதற்கு முன்பு இது மூல தரவுகளில் அழைக்கப்படுகிறது. செயலாக்கப்பட்ட மூல தரவை திருப்பித் தர வேண்டும். படத்தைத் தவிர்க்க எதுவும் திரும்பவும்.
- preprocess_raw_html(raw_html, url)[source]¶
பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொரு மூலத்துடனும் இந்த முறை அழைக்கப்படுகிறது: சொல்: html கோப்பு, ஒரு பொருள் மரத்தில் பாகுபடுத்தப்படுவதற்கு முன்பு. RAW_HTML என்பது வலையிலிருந்து பதிவிறக்கம் செய்யப்பட்ட மூல HTML ஐ குறிக்கும் யூனிகோட் சரம். HTML பதிவிறக்கம் செய்யப்பட்ட URL என்பது URL ஆகும்.
இந்த முறை * முன் * preprocess_regexps க்கு முன் செயல்படுகிறது என்பதை நினைவில் கொள்க.
இந்த முறை செயலாக்கப்பட்ட RAW_HTML ஐ யூனிகோட் பொருளாக திருப்பித் தர வேண்டும்.
- classmethod print_version(url)[source]¶
கட்டுரை உள்ளடக்கத்துடன் வலைப்பக்கத்தை சுட்டிக்காட்டி ஒரு url ஐ எடுத்து, கட்டுரையின் அச்சு பதிப்பை சுட்டிக்காட்டி: கால:` url`. இயல்பாக எதுவும் செய்யாது. உதாரணத்திற்கு:
def print_version(self, url): return url + '?&pagewanted=print'
- publication_date()[source]¶
இந்த பிரச்சினை வெளியிடப்பட்ட தேதியை அமைக்க இந்த முறையைப் பயன்படுத்தவும். பதிவிறக்கம் செய்யப்பட்ட தருணத்திற்கு இயல்புநிலை. திரும்ப வேண்டும் a: வகுப்பு: datetime.datetime பொருள்.
- skip_ad_pages(soup)[source]¶
பதிவிறக்கம் செய்யப்பட்ட ஒவ்வொன்றின் மூலத்துடன் இந்த முறை அழைக்கப்படுகிறது: சொல்: HTML கோப்பு, remate_tags போன்ற எந்தவொரு தூய்மைப்படுத்தும் பண்புகளுக்கும் முன், get_only_tags பயன்படுத்தப்படும். Preprocess_regexps ஏற்கனவே பயன்படுத்தப்பட்டிருக்கும் என்பதை நினைவில் கொள்க. செய்முறையை விளம்பர பக்கங்களைத் தவிர்க்க அனுமதிப்பதாகும். சூப் ஒரு விளம்பரப் பக்கத்தைக் குறிக்கிறது என்றால், உண்மையான பக்கத்தின் HTML ஐத் தரவும். இல்லையெனில் எதுவும் திரும்பவும்.
சூப்: ஒரு` அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> __ பதிவிறக்கம் செய்யப்பட்டுள்ள நிகழ்வு: கால: html.
- sort_index_by(index, weights)[source]¶
எடைகள் படி` குறியீட்டில்` தலைப்புகளை வரிசைப்படுத்த வசதி முறை. குறியீட்டு இடத்தில் வரிசைப்படுத்தப்பட்டுள்ளது. குறியீட்டு ஐத் தருகிறது.
குறியீட்டு: தலைப்புகளின் பட்டியல்.
எடைகள்: தலைப்புகளுக்கு எடைகளை வரைபடமாக்கும் அகராதி. குறியீட்டில் ஏதேனும் தலைப்புகள் எடையில் இல்லை என்றால், அவை 0 எடையைக் கொண்டிருப்பதாகக் கருதப்படுகிறது.
- classmethod tag_to_string(tag, use_alt=True, normalize_whitespace=True)[source]¶
ஒரு அழகான 3 <https://www.crummic.com/software/beautifulsoup/bs4/doc/> _ _: குறியீடு: குறிச்சொல்` ஆகியவற்றை எடுத்துக்கொள்வதற்கான வசதியான முறை, எந்த சிடா பிரிவுகளும் மற்றும் ஆல்ட் குறிச்சொல் உட்பட அதிலிருந்து மீண்டும் மீண்டும் உரையை பிரித்தெடுக்கவும் பண்புக்கூறுகள். வெற்று யூனிகோட் சரத்தை திருப்பித் தரவும்.
use_alt:` உண்மை` என்றால் எந்த உரை உள்ளடக்கமும் இல்லாத குறிச்சொற்களுக்கு ALT பண்புக்கூறைப் பயன்படுத்த முயற்சிக்கவும்
குறிச்சொல்:` பியூட்டிஃபுல் சப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/> _: குறியீடு: குறிச்சொல்`
- articles_are_obfuscated = False¶
உண்மை மற்றும் செயல்படுத்தவும்: மெத்: get_obfuscated_article வலைத்தளங்களைக் கையாள உள்ளடக்கத்தை துடைக்க கடினமாக முயற்சிக்கிறது.
- auto_cleanup = False¶
பதிவிறக்கம் செய்யப்பட்ட கட்டுரை பக்கங்களிலிருந்து எல்லா உரையையும் தானாகவே பிரித்தெடுக்கவும். வாசிப்பு திட்டத்திலிருந்து வழிமுறைகளைப் பயன்படுத்துகிறது. இதை உண்மையாக அமைத்தல், பதிவிறக்கம் செய்யப்பட்ட HTML ஐ கைமுறையாக சுத்தம் செய்வதைப் பற்றி நீங்கள் கவலைப்பட வேண்டியதில்லை (கையேடு தூய்மைப்படுத்தல் எப்போதும் உயர்ந்ததாக இருக்கும் என்றாலும்).
- auto_cleanup_keep = None¶
ஆட்டோ தூய்மைப்படுத்தும் வழிமுறை ஒருபோதும் அகற்றக்கூடாது என்ற கூறுகளைக் குறிப்பிடவும். தொடரியல் ஒரு எக்ஸ்பாத் வெளிப்பாடு. உதாரணத்திற்கு:
auto_cleanup_keep = '//div[@id="article-image"]' will keep all divs with id="article-image" auto_cleanup_keep = '//*[@class="important"]' will keep all elements with class="important" auto_cleanup_keep = '//div[@id="article-image"]|//span[@class="important"]' will keep all divs with id="article-image" and spans with class="important"
உண்மை என்றால் வழிசெலுத்தல் பட்டி மையம் சீரமைக்கப்பட்டதாக இருந்தால், இல்லையெனில் அது சீரமைக்கப்படுகிறது
- compress_news_images = False¶
அனைத்து அளவிடுதல் மற்றும் சுருக்க அளவுருக்களை புறக்கணிக்க இதை பொய்யாக அமைக்கவும், மாற்றப்படாத மூலம் படங்களை அனுப்பவும். உண்மை மற்றும் பிற சுருக்க அளவுருக்கள் அவற்றின் இயல்புநிலை மதிப்புகளில் விடப்பட்டால், வெளியீட்டு சுயவிவரத்தால் அமைக்கப்பட்ட திரை பரிமாணங்களில் பொருந்தும் வகையில் JPEG படங்கள் அளவிடப்படும் மற்றும் அதிகபட்சமாக (W * H)/16 அளவில் சுருக்கப்படும், அங்கு W x H என்பது அளவிடப்பட்ட பட பரிமாணங்கள் .
- compress_news_images_auto_size = 16¶
தானாக அமுக்க JPEG படங்களை பயன்படுத்தும்போது பயன்படுத்தப்படும் காரணி. எதுவுமில்லை என்றால், ஆட்டோ சுருக்கம் முடக்கப்பட்டுள்ளது. இல்லையெனில், படங்கள் (W * H)/சுருக்கம்_நியூஸ்_ஐஎம்ஜேஜ்கள்_ஆட்டோ_சைஸ் பைட்டுகள் தர அளவைக் குறைப்பதன் மூலம் குறைக்கப்படும், அங்கு w x h என்பது பிக்சல்களில் பட பரிமாணங்களாகும். குறைந்தபட்ச JPEG தரம் 5/100 ஆக இருக்கும், எனவே இந்த கட்டுப்பாடு பூர்த்தி செய்யப்படாது. இந்த அளவுருவை சுருக்கம்_நியூஸ்_ஐஎம்ஜேஜ்கள்_மாக்ஸ்_சிஸ் அளவுருவால் மீறலாம், இது படங்களுக்கு நிலையான அதிகபட்ச அளவை வழங்குகிறது. நீங்கள் scale_news_images_to_device ஐ இயக்கினால், படம் முதலில் அளவிடப்படும், பின்னர் அதன் அளவு (W * h)/காரணி குறைவாக இருக்கும் வரை அதன் தரம் குறையும், அங்கு W மற்றும் H இப்போது * அளவிடப்பட்ட * பட பரிமாணங்கள். வேறு வார்த்தைகளில் கூறுவதானால், இந்த சுருக்கம் அளவிடப்பட்ட பிறகு நிகழ்கிறது.
- compress_news_images_max_size = None¶
JPEG தரத்தை அமைக்கவும், எனவே படங்கள் கொடுக்கப்பட்ட அளவை விட அதிகமாக இருக்காது (KBytes இல்). அமைக்கப்பட்டால், இந்த அளவுரு தானாக சுருக்கத்தை அமுக்க_நியூஸ்_ஐஎம்ஜேஜ்கள்_ஆட்டோ_சிஸ் வழியாக மேலெழுதும். குறைந்தபட்ச JPEG தரம் 5/100 ஆக இருக்கும், எனவே இந்த கட்டுப்பாடு பூர்த்தி செய்யப்படாது.
- conversion_options = {}¶
பதிவிறக்கம் செய்யப்பட்ட உள்ளடக்கத்தை மின் புத்தகமாக மாற்றுவதைக் கட்டுப்படுத்த செய்முறை குறிப்பிட்ட விருப்பங்கள். இவை எந்தவொரு பயனர் அல்லது சொருகி குறிப்பிட்ட மதிப்புகளை மேலெழுதும், எனவே முற்றிலும் தேவைப்பட்டால் மட்டுமே பயன்படுத்தவும். உதாரணத்திற்கு:
conversion_options = { 'base_font_size' : 16, 'linearize_tables' : True, }
- cover_margins = (0, 0, '#ffffff')¶
இயல்பாக, Get_Cover_url () ஆல் வழங்கப்பட்ட அட்டை படம் குறிப்பிட்ட காலத்திற்கான அட்டையாக பயன்படுத்தப்படும். உங்கள் செய்முறையில் இதை மீறுவது பதிவிறக்கம் செய்யப்பட்ட அட்டையை ஒரு சட்டகமாக வழங்குமாறு அறிவுறுத்துகிறது, அதன் அகலமும் உயரமும் பதிவிறக்கம் செய்யப்பட்ட அட்டையின் சதவீதமாக வெளிப்படுத்தப்படுகின்றன. கவர்_மார்கின்ஸ் = (10, 15, '#FFFFFF') இடது மற்றும் வலதுபுறத்தில் ஒரு வெள்ளை விளிம்பு 10px, மேல் மற்றும் கீழ் 15px உடன் கவர். வண்ண பெயர்கள் வரையறுக்கப்பட்டுள்ளன இங்கே <https://www.imagemagick.org/script/color.php> _. சில காரணங்களால், வெள்ளை எப்போதும் விண்டோஸில் வேலை செய்யாது என்பதை நினைவில் கொள்க. அதற்கு பதிலாக #FFFFFF ஐப் பயன்படுத்தவும்
- delay = 0¶
நொடிகளில் தொடர்ச்சியான பதிவிறக்கங்களுக்கு இடையிலான இயல்புநிலை தாமதம். வாதம் மிகவும் துல்லியமான நேரத்தைக் குறிக்க மிதக்கும் புள்ளி எண்ணாக இருக்கலாம். காண்க: மெத்: URL தாமதங்களுக்கு செயல்படுத்த get_url_specific_delay.
- description = ''¶
உள்ளடக்கத்தை விவரிக்கும் இரண்டு வரிகள் இந்த செய்முறை பதிவிறக்குகிறது. இது முதன்மையாக ஒரு GUI இல் பயன்படுத்தப்படும், இது சமையல் பட்டியலை முன்வைக்கிறது.
- encoding = None¶
தவறான சார்ஸெட் விவரக்குறிப்பைக் கொண்ட தளங்களுக்கான மேலெழுதும் குறியாக்கத்தைக் குறிப்பிடவும். `` லத்தீன் 1`` ஐக் குறிப்பிடுவது மிகவும் பொதுவானது மற்றும் `` cp1252`` ஐப் பயன்படுத்துதல். எதுவுமில்லை என்றால், குறியாக்கத்தைக் கண்டறிய முயற்சிக்கவும். இது அழைக்கக்கூடியதாக இருந்தால், அழைக்கக்கூடியது இரண்டு வாதங்களுடன் அழைக்கப்படுகிறது: செய்முறை பொருள் மற்றும் மூலமானது டிகோட் செய்யப்பட வேண்டும். இது டிகோட் செய்யப்பட்ட மூலத்தை திருப்பித் தர வேண்டும்.
- extra_css = None¶
பதிவிறக்கம் செய்யப்பட்டவற்றில் சேர்க்கப்பட வேண்டிய கூடுதல்: கால: CSS ஐக் குறிப்பிடவும்: கால:` HTML` கோப்புகள். இது <syle> குறிச்சொற்களில் செருகப்படும், இதன் மூலம் </head> குறிச்சொல் அதன் மூலம் அனைத்தையும் மீறுகிறது: கால: css தனிநபர்: கால: கால:` html` குறிச்சொற்களைப் பயன்படுத்தி அறிவிக்கப்பட்டதைத் தவிர . கூடுதல்_சிஎஸ்எஸ்ஸை மேலெழுதும்: மெத்: get_extra_css () அதற்கு பதிலாக முறை ஆகியவற்றை நீங்கள் நிரல் முறையில் உருவாக்க விரும்பினால் என்பதை நினைவில் கொள்க. உதாரணத்திற்கு:
extra_css = '.heading { font: serif x-large }'
- feeds = None¶
பதிவிறக்கம் செய்ய ஊட்டங்களின் பட்டியல். `` [Url1, url2, ...] `` அல்லது (('தலைப்பு 1', url1), ('தலைப்பு 2', url2), ...] `
- filter_regexps = []¶
புறக்கணிக்க எந்த இணைப்புகளை தீர்மானிக்கும் வழக்கமான வெளிப்பாடுகளின் பட்டியல். காலியாக இருந்தால் அது புறக்கணிக்கப்படுகிறது. IS_link_wanted செயல்படுத்தப்படாவிட்டால் மட்டுமே பயன்படுத்தப்படுகிறது. உதாரணத்திற்கு:
filter_regexps = [r'ads\.doubleclick\.net']
விளம்பரங்கள். DoubleClick.net கொண்ட அனைத்து URL களையும் அகற்றும்.
ஒன்று மட்டுமே: ATTR: BasicNewsRecipe.match_regexps அல்லது: attr:` BasicNewsRecipe.filter_regexps` வரையறுக்கப்பட வேண்டும்.
- handle_gzip = True¶
நீங்கள் gziped இடமாற்றங்களைப் பயன்படுத்த விரும்பவில்லை என்றால் பொய்யாக அமைக்கவும். சில பழைய சேவையகங்கள் GZIP உடன் வெளியேறுகின்றன என்பதை நினைவில் கொள்க
- ignore_duplicate_articles = None¶
ஒன்றுக்கு மேற்பட்ட பிரிவுகளில் இருக்கும் கட்டுரைகளின் நகல்களைப் புறக்கணிக்கவும். ஒரு நகல் கட்டுரை என்பது ஒரே தலைப்பு மற்றும்/அல்லது URL ஐக் கொண்ட ஒரு கட்டுரை. அதே தலைப்பைக் கொண்ட கட்டுரைகளை புறக்கணிக்க, இதை அமைக்கவும்
ignore_duplicate_articles = {'title'}
அதற்கு பதிலாக URL களைப் பயன்படுத்த, அதை அமைக்கவும்
ignore_duplicate_articles = {'url'}
தலைப்பு அல்லது URL இல் பொருத்த, அதை அமைக்கவும்
ignore_duplicate_articles = {'title', 'url'}
- keep_only_tags = []¶
குறிப்பிட்ட குறிச்சொற்களையும் அவர்களின் குழந்தைகளையும் மட்டுமே வைத்திருங்கள். ஒரு குறிச்சொல்லைக் குறிப்பிடுவதற்கான வடிவமைப்பிற்கு: Attr: BasicNewsRecipe.Remove_tags. இந்த பட்டியல் காலியாக இல்லாவிட்டால், இந்த பட்டியலில் உள்ள உள்ளீடுகளுடன் பொருந்தக்கூடிய குறிச்சொற்களுடன் <உடல்> குறிச்சொல் காலியாகி மீண்டும் நிரப்பப்படும். உதாரணத்திற்கு:
keep_only_tags = [dict(id=['content', 'heading'])]
" உள்ளடக்கம் " அல்லது தலைப்பு" ` ஐடி` பண்புக்கூறு கொண்ட குறிச்சொற்களை மட்டுமே வைத்திருக்கும்.
- language = 'und'¶
செய்தி இருக்கும் மொழி. இரண்டு அல்லது மூன்று எழுத்துக்கள் நீளமாக ஐஎஸ்ஓ -639 குறியீடாக இருக்க வேண்டும்
- masthead_url = None¶
இயல்பாக, காலிபர் மாஸ்ட்ஹெட் (கின்டெல் மட்டும்) இயல்புநிலை படத்தைப் பயன்படுத்தும். உங்கள் செய்முறையில் இதை மீறுங்கள்.
- match_regexps = []¶
எந்த இணைப்புகளைப் பின்பற்ற வேண்டும் என்பதை தீர்மானிக்கும் வழக்கமான வெளிப்பாடுகளின் பட்டியல். காலியாக இருந்தால், அது புறக்கணிக்கப்படுகிறது. IS_link_wanted செயல்படுத்தப்படாவிட்டால் மட்டுமே பயன்படுத்தப்படுகிறது. உதாரணத்திற்கு:
match_regexps = [r'page=[0-9]+']
அவற்றில் பக்கம் = சில எண் கொண்ட அனைத்து URL களையும் பொருத்தும்.
ஒன்று மட்டுமே: ATTR: BasicNewsRecipe.match_regexps அல்லது: attr:` BasicNewsRecipe.filter_regexps` வரையறுக்கப்பட வேண்டும்.
- max_articles_per_feed = 100¶
ஒவ்வொரு ஊட்டத்திலிருந்தும் பதிவிறக்கம் செய்ய அதிகபட்ச கட்டுரைகள். கட்டுரை தேதிகள் இல்லாத ஊட்டங்களுக்கு இது முதன்மையாக பயனுள்ளதாக இருக்கும். பெரும்பாலான ஊட்டங்களுக்கு, நீங்கள் பயன்படுத்த வேண்டும்: ATTR: BasicNewsRecipe.oldest_article
- needs_subscription = False¶
உண்மை என்றால் GUI பயனருக்கு பயனர்பெயர் மற்றும் கடவுச்சொல்லை பதிவிறக்கும் போது பயன்படுத்துமாறு கேட்கும். "விரும்பினால்" என அமைக்கப்பட்டால், பயனர்பெயர் மற்றும் கடவுச்சொல்லின் பயன்பாடு விருப்பமாகிறது
- no_stylesheets = False¶
மின்-புத்தக வடிவங்களுக்கு மாற்றுவதற்கு பொருத்தமற்ற அதிகப்படியான சிக்கலான ஸ்டைல்ஷீட்களைக் கொண்ட வலைத்தளங்களுக்கான ஸ்டைல்ஷீட்களை ஏற்றுவதை முடக்க வசதியான கொடி. உண்மையான ஸ்டைல்ஷீட்கள் பதிவிறக்கம் செய்யப்பட்டு செயலாக்கப்படாவிட்டால்
- oldest_article = 7.0¶
இந்த செய்தி மூலத்திலிருந்து பதிவிறக்கம் செய்ய பழமையான கட்டுரை. நாட்களில்.
- preprocess_regexps = []¶
பட்டியல்: கால: REGEXP பதிவிறக்கம் செய்யப்பட்டவற்றில் இயக்க மாற்று விதிகள்: கால:` html`. பட்டியலின் ஒவ்வொரு உறுப்புகளும் இரண்டு உறுப்பு டப்பிள் ஆக இருக்க வேண்டும். டூப்பிளின் முதல் உறுப்பு தொகுக்கப்பட்ட வழக்கமான வெளிப்பாடாக இருக்க வேண்டும், மேலும் இரண்டாவது ஒரு மேட்ச் பொருளை எடுத்து போட்டியை மாற்றுவதற்கு ஒரு சரத்தை வழங்குகிறது. உதாரணத்திற்கு:
preprocess_regexps = [ (re.compile(r'<!--Article ends here-->.*</body>', re.DOTALL|re.IGNORECASE), lambda match: '</body>'), ]
<!-கட்டுரை இங்கே முடிவடைகிறது-> </body> `வரை அனைத்தையும் அகற்றும்.
- publication_type = 'unknown'¶
வெளியீட்டு வகை செய்தித்தாள், பத்திரிகை அல்லது வலைப்பதிவில் அமைக்கப்பட்டுள்ளது. எதுவுமில்லை என்றால், எந்த வெளியீட்டு வகை மெட்டாடேட்டா OPF கோப்பில் எழுதப்படாது.
- recipe_disabled = None¶
இந்த செய்முறையை முடக்க வெற்று அல்லாத சரத்திற்கு அமைக்கவும். சரம் முடக்கப்பட்ட செய்தியாக பயன்படுத்தப்படும்
- recursions = 0¶
கட்டுரை வலைப்பக்கங்களில் பின்பற்ற வேண்டிய இணைப்புகளின் நிலைகளின் எண்ணிக்கை
- remove_attributes = []¶
எல்லா குறிச்சொற்களிலிருந்தும் அகற்ற வேண்டிய பண்புகளின் பட்டியல். உதாரணத்திற்கு:
remove_attributes = ['style', 'font']
- remove_empty_feeds = False¶
உண்மையான வெற்று ஊட்டங்கள் வெளியீட்டிலிருந்து அகற்றப்பட்டால். துணை வகுப்பில் parse_index ஐ மீறினால் இந்த விருப்பம் எந்த விளைவையும் ஏற்படுத்தாது. ஊட்டங்கள் அல்லது: மெத்:` get_feeds` ஐப் பயன்படுத்தி ஊட்டங்களின் பட்டியலைத் தரும் சமையல் குறிப்புகளுக்கு மட்டுமே இது. நீங்கள் புறக்கணிப்பு_டூஃபிகேட்_ஆர்டிகல்ஸ் விருப்பத்தைப் பயன்படுத்தினால் இது பயன்படுத்தப்படுகிறது.
- remove_javascript = True¶
பதிவிறக்கம் செய்யப்பட்ட HTML இலிருந்து அனைத்து ஜாவாஸ்கிரிப்ட் குறிச்சொற்களையும் அகற்ற வசதியான கொடி
- remove_tags = []¶
அகற்றப்பட வேண்டிய குறிச்சொற்களின் பட்டியல். குறிப்பிடப்பட்ட குறிச்சொற்கள் பதிவிறக்கம் செய்யப்பட்ட HTML இலிருந்து அகற்றப்படுகின்றன. ஒரு குறிச்சொல் படிவத்தின் அகராதியாக குறிப்பிடப்பட்டுள்ளது
{ name : 'tag name', #e.g. 'div' attrs : a dictionary, #e.g. {'class': 'advertisment'} }
எல்லா விசைகளும் விருப்பமானவை. தேடல் அளவுகோல்களின் முழு விளக்கத்திற்கு, அழகான சூப் <https://www.crummy.com/software/beautifulsoup/bs4/doc/#searching-the-tree> __ ஒரு பொதுவான எடுத்துக்காட்டு
remove_tags = [dict(name='div', class_='advert')]
இது அனைத்து <div class =" விளம்பரம் "> குறிச்சொற்களையும் அவர்களின் அனைத்து குழந்தைகளையும் பதிவிறக்கம் செய்யப்பட்டவற்றிலிருந்து அகற்றும்: கால: html.
- remove_tags_after = None¶
குறிப்பிட்ட குறிச்சொல்லுக்குப் பிறகு ஏற்படும் அனைத்து குறிச்சொற்களையும் அகற்றவும். ஒரு குறிச்சொல்லைக் குறிப்பிடுவதற்கான வடிவமைப்பிற்கு: Attr: BasicNewsRecipe.Remove_tags. உதாரணத்திற்கு:
remove_tags_after = [dict(id='content')]
முதல் உறுப்புக்குப் பிறகு அனைத்து குறிச்சொற்களையும் ஐடி =" உள்ளடக்கம் " `அகற்றும்.
- remove_tags_before = None¶
குறிப்பிட்ட குறிச்சொல்லுக்கு முன் நிகழும் அனைத்து குறிச்சொற்களையும் அகற்று. ஒரு குறிச்சொல்லைக் குறிப்பிடுவதற்கான வடிவமைப்பிற்கு: Attr: BasicNewsRecipe.Remove_tags. உதாரணத்திற்கு:
remove_tags_before = dict(id='content')
முதல் உறுப்புக்கு முன் ஐடி =" உள்ளடக்கம் " `உடன் எல்லா குறிச்சொற்களையும் அகற்றும்.
- requires_version = (0, 6, 0)¶
இந்த செய்முறையைப் பயன்படுத்த குறைந்தபட்ச காலிபர் பதிப்பு தேவை
- resolve_internal_links = False¶
உண்மை என அமைக்கப்பட்டால், பதிவிறக்கம் செய்யப்பட்ட கட்டுரைகளில் உள்ள இணைப்புகள் பதிவிறக்கம் செய்யப்பட்ட பிற கட்டுரைகளை சுட்டிக்காட்டுகின்றன, அதன் அசல் வலை URL ஐ விட கட்டுரையின் பதிவிறக்கம் செய்யப்பட்ட நகலை சுட்டிக்காட்டுகின்றன. இதை நீங்கள் உண்மையாக அமைத்தால், நீங்கள் செயல்படுத்த வேண்டியிருக்கலாம்: மெத்: உங்கள் குறிப்பிட்ட வலைத்தளத்தின் URL திட்டத்துடன் பணியாற்ற canonicalize_internal_url.
- reverse_article_order = False¶
ஒவ்வொரு ஊட்டத்திலும் கட்டுரைகளின் வரிசையை மாற்றியமைக்கவும்
- scale_news_images = None¶
படங்களை அளவிட அதிகபட்ச பரிமாணங்கள் (W, H). SCALE_NEWS_IMAGES_TO_DEVICE உண்மை என்றால், இது சுயவிவரத் தொகுப்பு எதுவும் இல்லாவிட்டால் வெளியீட்டு சுயவிவரத்தால் அமைக்கப்பட்ட சாதனத் திரை பரிமாணங்களுக்கு அமைக்கப்பட்டுள்ளது, இந்த விஷயத்தில் அது ஒதுக்கப்பட்ட எந்த மதிப்பிலும் (இயல்புநிலை எதுவுமில்லை) விடப்படுகிறது.
- scale_news_images_to_device = True¶
வெளியீட்டு சுயவிவரத்தால் அமைக்கப்பட்ட சாதனத் திரை பரிமாணங்களில் பொருந்தக்கூடிய படங்களை மீட்டெடுக்கவும். வெளியீட்டு சுயவிவரம் அமைக்கப்படாவிட்டால் புறக்கணிக்கப்படுகிறது.
- simultaneous_downloads = 5¶
ஒரே நேரத்தில் பதிவிறக்கங்களின் எண்ணிக்கை. சேவையகம் சேகரிப்பதாக இருந்தால் 1 ஆக அமைக்கவும். தானாகவே 1 எனக் குறைக்கப்படுகிறது: ATTR: BasicNewsRecipe.Delay> 0
- summary_length = 500¶
குறுகிய விளக்கத்தில் அதிகபட்ச எழுத்துக்களின் எண்ணிக்கை
- template_css = '\n .article_date {\n color: gray; font-family: monospace;\n }\n\n .article_description {\n text-indent: 0pt;\n }\n\n a.article {\n font-weight: bold; text-align:left;\n }\n\n a.feed {\n font-weight: bold;\n }\n\n .calibre_navbar {\n font-family:monospace;\n }\n '¶
வார்ப்புருக்கள், அதாவது, வழிசெலுத்தல் பார்கள் மற்றும் உள்ளடக்கங்களின் அட்டவணைகள் ஆகியவற்றை பாணி செய்யப் பயன்படும் CSS. இந்த மாறியை மீறுவதற்குப் பதிலாக, தோற்றத்தையும் உணர்வையும் தனிப்பயனாக்க உங்கள் செய்முறையில் `கூடுதல்_சிஎஸ்ஸைப் பயன்படுத்த வேண்டும்.
- timefmt = ' [%a, %d %b %Y]'¶
முதல் பக்கத்தில் காட்டப்பட்டுள்ள தேதிக்கான வடிவமைப்பு சரம். இயல்பாக: day_name, day_number monthy_name ஆண்டு
- timeout = 120.0¶
சேவையகத்திலிருந்து கோப்புகளை நொடிகளில் பெறுவதற்கான நேரம் முடிந்தது
- title = 'தெரியாத செய்தி ஆதாரம்'¶
மின் புத்தகத்திற்கு பயன்படுத்த வேண்டிய தலைப்பு
- use_embedded_content = None¶
உட்பொதிக்கப்பட்ட உள்ளடக்கத்தின் நீளத்தின் அடிப்படையில் ஒரு ஊட்டத்தில் முழு கட்டுரைகள் பதிக்கப்பட்டுள்ளனவா என்று பொதுவாக யூகிக்க முயற்சிக்கிறோம். எதுவுமில்லை 'என்றால், இயல்புநிலை யூகம் பயன்படுத்தப்படுகிறது. `உண்மை என்றால், ஊட்டங்கள் உள்ளடக்கத்தை உட்பொதித்ததாக நாங்கள் எப்போதும் கருதுகிறோம்,` பொய் 'என்றால், தீவனத்தில் உட்பொதிக்கப்பட்ட உள்ளடக்கம் இல்லை என்று நாங்கள் எப்போதும் கருதுகிறோம்.