Eksperti Semalt: Si të ekstraktoni tekstin nga faqet e internetit

Ndërsa ka mjete scraping atje të afta për nxjerrjen e të dhënave nga faqet e shumta në disa sekonda, mënyra e sigurt për nxjerrjen e tekstit nga faqet në internet ka qenë gjithnjë duke nënvizuar dhe kopjuar tekstin. Por kjo metodë është disi e rëndë sidomos në rastet kur ju duhet të kopjoni tekstin nga shumë faqe. Gjithashtu, zhvilluesit e uebit po vijnë me mjete për të kyçur përmbajtjen e një faqe në internet për të parandaluar "kopjimin" e saj.
Tani për të filluar, ekzistojnë metoda të ndryshme të shpejta për nxjerrjen e tekstit nga faqet e internetit. Në varësi të sasisë së tekstit që doni të merrni, mund të zgjidhni midis mënyrave të mëposhtme:

1. Metoda e ruajtjes së faqes
Kjo teknikë mbështetet në aftësinë e shfletuesve për të ruajtur një kopje të faqes aktuale të internetit në vend. Për ta bërë këtë thjesht mbani butonat e kontrollit + S së bashku ose mund të klikoni me të djathtën në faqe dhe zgjidhni ruajeni faqen nga menuja që shfaqet. Kjo do të nisë një dritare eksploruese që kërkon që ju të specifikoni disa atribute të faqes në internet.
Në pjesën e poshtme, ekziston një opsion "filename" që do t'ju japë mundësinë të specifikoni emrin e skedarit të faqes në internet. Shtë e rëndësishme të theksohet se shfletuesi gjithashtu do të krijojë një dosje me një emër të ngjashëm që do të përmbajë të gjitha të dhënat e bashkangjitura nga faqja në internet, si imazhet dhe sfondet.
Më poshtë, ekziston një opsion "save as type" që ju lejon të specifikoni se cili lloj skedari dëshironi të ruhet si. Duke marrë parasysh që ne jemi të interesuar për tekstin, zgjidhni vetëm ruajtjen si ".txt" e cila automatikisht do të krijojë një skedar teksti që përmban të gjithë tekstin e faqes në internet dhe mund të redaktohet duke përdorur çdo procesor fjalësh. Kjo metodë është veçanërisht e dobishme në skenarët ku duhet të kopjoni faqe të plota. Në rast se ju duhet të lini jashtë disa pjesë të tekstit thjesht hapni skedarin e tekstit dhe shkurtoni tekstin e panevojshëm.

2. Metoda Ctrl + C dhe Ctrl + V
Ky është ndoshta mashtrimi më i vjetër në libër, duke përdorur vetëm miun për të nxjerrë në pah tekstin që dëshironi të ekstraktoni, më pas mund të vazhdoni ta kopjoni dhe ngjitur diku tjetër. Kjo metodë është e dobishme kur duhet të kopjoni copëza dhe t'i përdorni shpejt ato në një dokument tjetër.
Për ta realizuar këtë, duhet të shkoni te pjesa që përmban tekstin që ju nevojitet, shtypni dhe mbani butonin e majtë të miut për të zhvendosur kursorin nga modaliteti "navigacion" në mënyrën "e theksuar". Kjo do t'ju lejojë të theksoni tekstin, për ta bërë këtë të vazhdoni të mbani butonin e majtë të miut dhe të lëvizni kursorin për të nënvizuar tekstin tuaj. Kur të keni mbaruar, lëshoni butonin dhe klikoni me të djathtën mbi tekstin që keni kopjuar për të shfaqur menunë e lundrimit. Në të klikon në opsionin "kopje" për të kopjuar tekstin e zgjedhur.
Shkoni te dokumenti i tekstit ku dëshironi të ruani tekstin dhe kliko me të djathtën për të paraqitur menunë dhe klikoni mbi ngjitur.
Shtë e rëndësishme të theksohet që ju mund të zgjidhni midis mënyrave të ndryshme të ngjitjes, por nëse jeni të interesuar vetëm për tekstin, klikoni në Paste si tekst i thjeshtë.