Xây dựng Trình lập lịch tải xuống với ít kỹ năng lập trình

Mục lục:

Xây dựng Trình lập lịch tải xuống với ít kỹ năng lập trình
Xây dựng Trình lập lịch tải xuống với ít kỹ năng lập trình

Video: Xây dựng Trình lập lịch tải xuống với ít kỹ năng lập trình

Video: Xây dựng Trình lập lịch tải xuống với ít kỹ năng lập trình
Video: Hướng dẫn thay đổi hình ảnh nền Background trong Slide PowerPoint 365 // Nguyễn Ngọc Dương - YouTube 2024, Tháng tư
Anonim

Chúng tôi đều thích tải xuống nội dung từ internet và có rất nhiều công cụ quản lý tải xuống tuyệt vời mà chúng tôi có thể sử dụng để lên lịch tải xuống của mình. Việc sử dụng trình quản lý tải xuống có thể dễ dàng hơn, nhưng không có hại gì khi khám phá các công cụ đã có trong Ubuntu của chúng tôi và sử dụng đầy đủ.

Trong bài viết này, chúng tôi sẽ cho bạn thấy một phần mềm tích hợp trong Ubuntu mà chúng tôi có thể sử dụng để tải xuống nội dung từ internet bằng cách sử dụng wget. Trên hết, chúng tôi sẽ hướng dẫn bạn cách lên lịch tải xuống bằng Cron.

Tải xuống bằng Wget

Wget là một gói phần mềm miễn phí để truy xuất các tệp bằng HTTP, HTTPS và FTP, các giao thức Internet được sử dụng rộng rãi nhất. Nó là một công cụ dòng lệnh không tương tác, do đó, nó có thể dễ dàng được gọi từ các tập lệnh, công việc cron, thiết bị đầu cuối không hỗ trợ X-Windows, v.v.

Mở thiết bị đầu cuối của bạn và hãy khám phá cách chúng tôi có thể sử dụng wget để tải xuống nội dung từ mạng. Cú pháp cơ bản của việc tải xuống với wget là như sau:

wget [tùy chọn]… …

Lệnh này sẽ tải xuống hướng dẫn sử dụng wget vào ổ đĩa cục bộ của bạn

wget https://www.gnu.org/software/wget/manual/wget.pdf

Linux Cron

Ubuntu đi kèm với một cron daemon được sử dụng để lập kế hoạch các nhiệm vụ được thực thi tại một thời điểm nhất định. Crontab cho phép bạn chỉ định các hành động và thời gian mà chúng sẽ được thực thi. Đây là cách bạn thường lên lịch một tác vụ bằng cách sử dụng công cụ dòng lệnh.

Mở một cửa sổ đầu cuối và nhập crontab -e.

Đó là cơ bản về wget và cách Cron hoạt động. Chúng ta hãy loot theo một ví dụ thực tế về cách lên lịch tải xuống.

Lập lịch tải xuống

Chúng tôi sẽ tải xuống Firefox 3.6 lúc 2 giờ sáng. Vì ISP của chúng tôi chỉ cung cấp một lượng dữ liệu giới hạn, chúng tôi cần dừng tải xuống lúc 8 giờ sáng. Đây là hình thức thiết lập.

[code] 0 2 * * * wget -c https://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB [/code]

Tùy chọn -c biểu thị rằng wget sẽ tiếp tục tải xuống hiện tại nếu nó chưa được hoàn thành.

Lệnh thứ tư sẽ dừng lại lúc 8 giờ sáng. ‘Killall’ là lệnh unix giết các quá trình theo tên.

[code] 0 8 * * * killall wget [/code]

Các killall wget nói với Ubuntu để ngừng wget từ tải tập tin tại 8 AM.

Các lệnh wget hữu dụng khác

1. Chỉ định thư mục để tải xuống tệp

[code] wget –output-document = / home / zainul / Tải xuống / wget manual.pdf https://www.gnu.org/software/wget/manual/wget.pdf [/code]

tùy chọn –output-document cho phép bạn chỉ định thư mục và tên của tệp mà bạn tải xuống

2. Tải xuống trang web

wget cũng có khả năng tải xuống một trang web.

[code] wget -m https://www.google.com/profiles/zainul.franciscus [/code]

Lệnh trên sẽ tải xuống toàn bộ trang web tiểu sử trên Google của tôi. Tùy chọn ‘-m’ cho wget tải xuống hình ảnh ‘gương’ của URL được chỉ định.

Một lựa chọn quan trọng khác là cho biết có bao nhiêu liên kết sau khi nó tải xuống một trang web.

[code] wget -r -l1 https://www.google.com/profiles/zainul.franciscus [/code]

Lệnh wget trên sử dụng hai tùy chọn. Tùy chọn đầu tiên ‘-r’ yêu cầu bạn phải tải xuống trang web được chỉ định một cách đệ quy. Tùy chọn thứ hai ‘-l1’ yêu cầu wget chỉ nhận được cấp liên kết đầu tiên từ trang web được chỉ định đó. Chúng tôi có thể thiết lập ba cấp độ ‘-l2’ và ‘-l3’.

3. Bỏ qua mục robot

Web master duy trì một tập tin văn bản được gọi là Robot.txt. ‘Robot.txt’ duy trì danh sách URL mà trình thu thập thông tin trang web như wget không nên thu thập thông tin. Chúng tôi có thể yêu cầu wget bỏ qua tùy chọn ‘Robot.txt’ với tùy chọn ‘-erobots = off’. Lệnh sau đây yêu cầu wget tải xuống trang đầu tiên của tiểu sử trên Google của tôi và bỏ qua ‘Robot.txt.

[code] wget -erobots = tắt https://www.google.com/profiles/zainul.franciscus [/code]

Một lựa chọn hữu ích khác là -U. Tùy chọn này sẽ che dấu wget dưới dạng trình duyệt. Lưu ý rằng việc che dấu một ứng dụng dưới dạng một ứng dụng khác có thể vi phạm điều khoản và dịch vụ của một nhà cung cấp dịch vụ web.

[code] wget -erobots = off -U Mozilla https://www.google.com/profiles/zainul.franciscus [/code]

Phần kết luận

Wget là một trường học rất cũ nhưng gói phần mềm GNU có thể hack được mà chúng ta có thể sử dụng để tải xuống các tệp. Wget là một công cụ dòng lệnh tương tác có nghĩa là chúng ta có thể cho phép nó chạy trên máy tính của chúng tôi trong nền mà không cần phải bắt đầu bất kỳ ứng dụng nào. Kiểm tra trang người đàn ông wget

[code] $ man wget [/code]

để hiểu các tùy chọn khác mà chúng tôi có thể sử dụng với wget.

Liên kết

Hướng dẫn sử dụng Wget Làm thế nào để kết hợp hai tập tin tải xuống khi wget không nửa chừng Linux QuickTip: Tải xuống và Hủy đăng ký trong một bước

Đề xuất: