Technopedia Center
PMB University Brochure
Faculty of Engineering and Computer Science
S1 Informatics S1 Information Systems S1 Information Technology S1 Computer Engineering S1 Electrical Engineering S1 Civil Engineering

faculty of Economics and Business
S1 Management S1 Accountancy

Faculty of Letters and Educational Sciences
S1 English literature S1 English language education S1 Mathematics education S1 Sports Education
  • Registerasi
  • Brosur UTI
  • Kip Scholarship Information
  • Performance
  1. Weltenzyklopädie
  2. Scrapy — Wikipédia
Scrapy — Wikipédia 👆 Click Here! Read More..
Un article de Wikipédia, l'encyclopédie libre.

Cet article est une ébauche concernant l’informatique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.
Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus.

Cet article ne cite pas suffisamment ses sources (juillet 2022).

Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».

En pratique : Quelles sources sont attendues ? Comment ajouter mes sources ?
Scrapy
Description de l'image Scrapy logo.png.

Informations
Développé par Pablo Hoffman (d)Voir et modifier les données sur Wikidata
Dernière version 2.13.4 (17 novembre 2025)[1]Voir et modifier les données sur Wikidata
Dépôt github.com/scrapy/scrapyVoir et modifier les données sur Wikidata
Assurance qualité Intégration continueVoir et modifier les données sur Wikidata
Écrit en Python
Système d'exploitation Microsoft Windows, Linux, macOS et Berkeley Software DistributionVoir et modifier les données sur Wikidata
Environnement Multi-plateforme
Langues Anglais
Type Robot d'indexation
Licence BSD 3-clauses[2]
Site web www.scrapy.org

modifier - modifier le code - voir Wikidata (aide)

Scrapy est un framework open-source permettant la création de robots d'indexation. Développé en Python, il dispose d'une forte communauté, offrant de nombreux modules supplémentaires. La première version stable est publiée en septembre 2009[3]. Le framework dispose d'une communauté active, et un support commercial est effectué par plusieurs entreprises[4].

Caractéristiques

[modifier | modifier le code]

L'équipe responsable du développement du framework lui confère plusieurs caractéristiques[5] :

  • Simple : aucune notion avancée en Python n'est nécessaire pour utiliser Scrapy
  • Productif : l'empreinte de code à générer est très courte, la plupart des opérations sont gérées par Scrapy
  • Rapide : le framework est rapide, avec une gestion d'actions en parallèle notamment
  • Extensible : chaque robot peut être personnalisés via des extensions, modifiant son comportement
  • Portable : les robots Scrapy sont compatibles Linux, Windows, Mac et BSD
  • Open Source
  • Robuste, grâce à une batterie de tests effectuées aussi bien par les développeurs que la communauté

Exemple de robot

[modifier | modifier le code]

Le site web du projet propose un tutoriel détaillé sur l'utilisation de Scrapy[6]. Ce cours propose notamment plusieurs exemples, comme celui ci-contre, extrayant certains liens présents sur plusieurs pages web.

from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector

from tutorial.items import DmozItem

class DmozSpider(BaseSpider):
   name = "dmoz"
   allowed_domains = ["dmoz.org"]
   start_urls = [
       "http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
       "http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
   ]

   def parse(self, response):
       hxs = HtmlXPathSelector(response)
       sites = hxs.select('//ul/li')
       items = []
       for site in sites:
           item = DmozItem()
           item['title'] = site.select('a/text()').extract()
           item['link'] = site.select('a/@href').extract()
           item['desc'] = site.select('text()').extract()
           items.append(item)
       return items

Notes et références

[modifier | modifier le code]
  1. ↑ « Release 2.13.4 », 17 novembre 2025 (consulté le 18 novembre 2025)
  2. ↑ https://github.com/scrapy/scrapy/blob/master/LICENSE
  3. ↑ Scrapy 0.7 release candidate is available!, consulté le 17 août 2012
  4. ↑ Scrapy Commercial support, consulté le 29 août 2012
  5. ↑ Scrapy overview, consulté le 17 août 2012
  6. ↑ Scrapy at a glance
v · m
Python
Implémentation
  • CPython
  • IronPython
  • Jython
  • Numba
  • PyPy
  • Shed Skin
  • Stackless Python
Framework
  • CherryPy
  • Django
  • Flask
  • Mako
  • PyObjC (en)
  • Qt
    • PyQt
    • PySide
  • PyGTK
  • Scrapy
  • TurboGears
  • Web2py
IDE
  • Anjuta
  • IDLE
  • KDevelop
  • Komodo
  • Microsoft Visual Studio
  • PyCharm
  • Spyder
  • Visual Studio Code
Organisations
  • Python Software Foundation
  • Django Software Foundation
  • Django Girls
  • PyLadies
Autres
  • Python Software Foundation License
  • Pip
  • Liste de logiciels Python
  • Guido van Rossum
  • PyCon
  • PyPI
v · m
Frameworks web
Python
  • Django
  • Flask
  • Tornado (framework) (en)
  • Scrapy
  • Twisted
  • Web2py
  • CherryPy
  • Pyramid
  • TurboGears
PHP
  • Symfony
  • API Platform
  • Zend Framework
  • CodeIgniter
  • FuelPHP
  • Yii
  • CakePHP
  • QCodo
  • Laravel
  • Jelix
  • Agavi
  • Atomik
  • Copix
  • Kumbia PHP
  • PRADO
  • WebSite-PHP
  • Phalcon
Ruby
  • Ruby on Rails
  • Sinatra
  • Merb
Perl
  • Catalyst
  • Dancer
  • Mojolicious
Smalltalk Seaside
JavaScript
Côté serveur
  • Express.js
  • Meteor
Côté client
  • Angular
  • AngularJS
  • Backbone.js
  • Cappuccino
  • Dojo
  • Ember.js
  • Ext JS
  • Meteor
  • MooTools
  • Prototype
  • qooxdoo
  • React
  • script.aculo.us
  • YUI
  • Vue.js
  • Svelte
CSS
  • Blueprint
  • Frameworks d'interface
    • Bootstrap
    • Foundation
Java
  • Jakarta EE
  • Spring
  • Struts
  • Tapestry
  • Play
  • Stripes
  • ZK
  • Cocoon
  • GWT
  • Echo
  • AppFuse
  • Grails
  • RAP
  • Wicket
  • WebObjects
  • Vert.x
  • Quarkus
.NET
  • ASP.NET
  • ASP.NET AJAX
  • icône décorative Portail de la programmation informatique
Ce document provient de « https://fr.teknopedia.teknokrat.ac.id/w/index.php?title=Scrapy&oldid=230307323 ».
Catégories :
  • Framework de programmation
  • Python
Catégories cachées :
  • Wikipédia:ébauche informatique
  • Article manquant de références depuis juillet 2022
  • Article manquant de références/Liste complète
  • Page utilisant P178
  • Page utilisant P348
  • Page utilisant P1324
  • Page utilisant P2992
  • Page utilisant P306
  • Article utilisant une Infobox
  • Article contenant un appel à traduction en anglais
  • Portail:Programmation informatique/Articles liés
  • Portail:Informatique/Articles liés

  • indonesia
  • Polski
  • الرية
  • Deutsch
  • English
  • Español
  • Français
  • Italiano
  • مصر
  • Nederlands
  • 本語
  • Português
  • Sinugboanong Binisaya
  • Svenska
  • Українска
  • Tiếng Việt
  • Winaray
  • 中文
  • Русски
Sunting pranala
Pusat Layanan

UNIVERSITAS TEKNOKRAT INDONESIA | ASEAN's Best Private University
Jl. ZA. Pagar Alam No.9 -11, Labuhan Ratu, Kec. Kedaton, Kota Bandar Lampung, Lampung 35132
Phone: (0721) 702022
Email: pmb@teknokrat.ac.id