metafrasi banner

web scraping (web harvesting, web data extraction)

surfmadpig

New member
Scraping, or web scraping, is the action of taking content from one web site for use on another. This data extraction can be done either manually or by an automated method.

There are many tools created just to harvest blog posts, articles and photos from web sites. While there are some things that can be done to block these tools and programs, it is almost impossible to stop the copy / paste action by an actual person.

This is most commonly done by spam sites looking for free content to help attract visitors.

Τη βρήκα σε μια ομιλία, στην οποία μπορώ κάλλιστα να χρησιμοποιήσω κάτι περιφραστικό που να αποδίδει το νόημα αλλά αναρωτιόμουν αν υπάρχει ελληνικός όρος, στο κάτω-κάτω χειρωνακτικά ή/και αυτοματοποιημένα είναι μάλλον η αγαπημένη τεχνική του μέσου Έλληνα ιδιοκτήτη "ειδησεογραφικού" ιστολογίου.
 

nickel

Administrator
Staff member
Δεν είναι ιδιαίτερα εύστοχοι οι αγγλικοί όροι ούτε περιγράφουν ίδια πράγματα:
data extraction = εξαγωγή δεδομένων (όρος με διάφορες σημασίες)
web harvesting = διαδικτυακό «καρπολόγημα»
web scraping = περισυλλογή περιεχομένου (αλλά από πού ξεκινά το αγγλικό; από το scraping the barrel;)

Στο βαθμό που χρησιμοποιείς ξένη δουλειά για να γεμίζεις τον δικό σου ιστοχώρο και να εξασφαλίζεις πλασματικές επισκέψεις χωρίς καμία προστιθέμενη αξία άλλη από τη συναθροιστική, τότε έχουμε καθαρή λογοκλοπή, για την ακρίβεια ιδιοποίηση διαδικτυακού περιεχομένου. Είναι ωστόσο τόσο διαδεδομένο το φαινόμενο που φαντάζομαι ότι σπάνια γίνεται πια κάτι για να αποκατασταθεί κάποια τάξη. Βέβαια, αν ένας μεγάλος ιστότοπος εκμεταλλευτεί χωρίς άδεια το περιεχόμενο άλλου μεγάλου ιστότοπου, δεν θα μείνουν αδιάφοροι οι θιγόμενοι.

Ωστόσο, δεν έχουμε μόνο αυτή τη συναθροιστική ιδιοποίηση περιεχομένου. Υπάρχει και η συναθροιστική δουλειά με μικρή ή μεγαλύτερη προστιθέμενη αξία. Ακόμα και η δουλειά που κάνουν οι μηχανές αναζήτησης χωράει εδώ.

Γι' αυτό το λόγο, αν χρειαστεί κάποιος όρος-ομπρέλα για τους αγγλικούς (που δεν θεωρώ ότι είναι συνώνυμοι), θα μπορούσαμε να κινηθούμε στην περιοχή περισυλλογή / συνάθροιση διαδικτυακού περιεχομένου.

Να το σκεφτούμε κι άλλο.
 

cougr

¥
[...]web scraping = περισυλλογή περιεχομένου (αλλά από πού ξεκινά το αγγλικό; από το scraping the barrel;)[...]

Απλώς είναι συνώνυμο των extract/copy (computer data).
 

surfmadpig

New member
Νομίζω πως το data extraction μπορεί να είναι για διάφορους σκοπούς (και απόλυτα καλόβουλους/ηθικούς), είναι απλά η γενικότερη μέθοδος με την οποία γίνεται το web scraping. Αντίστοιχα, το web harvesting είναι το data extraction όταν αφορά ειδικά τον ιστό και όχι πχ. άλλου είδους δεδομένα από τοπικά αρχεία κλπ.

Το web scraping μπορεί να ξεκίνησε ως συνώνυμο του web harvesting, αλλά νομίζω έχει πάρει αρνητική χροιά. Οι αναφορές σε ιστοσελίδες που παίρνουν συστηματικά περιεχόμενο από άλλες με σκοπό την ιδιωτικόποίηση του περιεχομένου τους που ανέφερες, nickel, χρησιμοποιούν συχνότερα τη λέξη scraping παρά το harvesting, έχω την εντύπωση.

Αν ισχύει κάτι τέτοιο, η "περισυλλογή περιεχομένου" δεν αποδίδει την αρνητική χροιά του scraping κατά τη γνώμη μου.

Πάντως καλά συμπεραίνω πως δεν υπάρχει καθιερωμένος ελληνικός όρος;
 

nickel

Administrator
Staff member
Αν ισχύει κάτι τέτοιο, η "περισυλλογή περιεχομένου" δεν αποδίδει την αρνητική χροιά του scraping κατά τη γνώμη μου.

Το είχα σκεφτεί κι εγώ, αλλά δίστασα να προτείνω τα... περιμαζώματα. :)
 

nickel

Administrator
Staff member
Προσοχή, μην μπερδέψουμε τον κόσμο.

Άλλο το scrap (το ρήμα scrap, scrapping, scrapped σημαίνει «σκαρτάρω») και άλλο το scrape (scraping, scraped) «ξύνω, γδέρνω». Πιστεύω ότι το web scraping έχει σχέση με το scrape the barrel, αλλά δεν το έχω ψάξει. Πάντως, οπωσδήποτε παραπέμπει σε κάτι «κατώτερο» από το harvesting.


http://en.wiktionary.org/wiki/scrape?rdfrom=Scrape
 

nickel

Administrator
Staff member
Καλησπέρα, η λέξη aggregator πόσο σχετική είναι;

Καλησπέρα. Πολύ σχετική, γι' αυτό άλλωστε αναφέρθηκα σε συνάθροιση διαδικτυακού περιεχομένου στο #2. Οι συναθροιστές μπορεί να συγκεντρώνουν και να αναδημοσιεύουν ειδήσεις, ενώ οι scrapers να μαζεύουν άλλα δεδομένα, π.χ. τιμές για σύγκριση, αλλά δεν έχω καταλάβει αν υπάρχουν σοβαρές διαφορές στις βασικές λειτουργίες: τον τρόπο περισυλλογής των δεδομένων (προγράμματα-ρομπότ) και την αναπαραγωγή ξένου περιεχομένου (συχνά ξένης πνευματικής ιδιοκτησίας).
 

patrogano

New member
Δεν υπάρχουν για όλες τις λέξεις ακριβείς μεταφράσεις για αυτό ας τις χρησιμοποιούμε όπως είναι, αυτούσιες!
 
Top