PHP

Tìm kiểu hàm Header trong PHP và cách viết Một code download đơn giản để dấu link thật đến file

GIỚI THIỆU
Có lẽ cũng không cần giới thiệu nhiều về nhu cầu “giấu diếm” này vì hiện nay có khá nhiều site sử dụng cách quản lý download như vậy và cũng có số lượng cũng nhiều không kém các site mới muốn tìm hiểu và sử dụng nó😉 Tuy nhiên, có lẽ không thừa nếu như chúng ta tìm hiểu kỹ hơn một chút về lý do sử dụng một chương trình download manager trên website để giấu đường dẫn thực sự đến các file download.
Quản lý băng thông và “tài sản” là 2 lý do chính để sử dụng 1 chương trình quản lý download trên website. Bạn thử tưởng tượng có 1 website cho download nhạc hoặc ebook với 1 mức phí nho nhỏ, nếu mà link để download trực tiếp các file bị lộ tùm lum thì thứ nhất là “lỗ vốn”, thứ hai là bandwidth sẽ hết sạch nhanh đến nỗi trước khi bạn kịp hiểu chuyện gì đã xảy ra.
Một số lý do khác cũng “chính đáng” không kém ví dụ như bạn muốn đếm số lần download file; hoặc website của bạn tự upload file của mình lên và các file này lại nằm trong database hoặc được để trong 1 thư mục mà từ ngoài web không đọc được. Trong những trường hợp như vậy, sử dụng 1 chương trình quản lý download trên website sẽ khá tiện lợi.
Tuy nhiên, cũng có vài điều cần chú ý trước khi bạn quyết định sử dụng 1 chương trình quản lý download trên website của mình:

  • Tốc độ download sẽ chậm hơn rất nhiều so với download file trực tiếp.
  • Server sẽ phải xử lý nhiều công việc hơn so với khi cho phép download file trực tiếp.
  • Nếu file được lưu trữ trong database, bạn nên chú ý rằng số lượng kết nối đồng thời vào database là có hạn, trong khi với 1 file có dung lượng lớn, có thể phải mất tới nửa tiếng hoặc hơn để download.

CHƯƠNG TRÌNH ĐẦU TIÊN
Giả sử bạn có 1 file document.zip trong cùng thư mục với file download.php. Nhưng chỉ mình bạn biết là file document.zip này nằm ở đâu, người khác muốn download thì phải truy cập vào file download.php của bạn. Mã nguồn của file download.php sẽ như sau:

PHP Code:
//file download.php
<?php
$filename = "document.zip";
$fp = fopen($filename, "rb");

header("Content-type: application/octet-stream");
header("Content-length: " . filesize($filename));

fpassthru($fp);
fclose($fp);
?>

Ủa, chỉ có nhiêu đó thôi à? Đúng vậy, chỉ có vỏn vẹn 10 dòng là có được 1 chương trình download manager đơn giản (dĩ nhiên là chương trình này chỉ cho phép download được mỗi 1 file document.zip, ta còn phải làm việc nhiều để cho chương trình hoàn thiện hơn!).
Đầu tiên, ta mở file document.zip để đọc ở chế độ nhị phân (binary):

PHP Code:
$fp = fopen($filename, "rb");.

Tiếp theo ta báo cho browser biết data trả về từ server là dữ liệu nhị phân chứ không phải là văn bản HTMl như thông thường:

PHP Code:
header("Content-type: application/octet-stream");

.
Đồng thời ta cũng báo cho browser biết dung lượng của file sẽ được tải xuống:

PHP Code:
header("Content-length: " . filesize($filename));

.
Và cuối cùng là đọc nội dung file và echo lại cho browser download:

PHP Code:
fpassthru($fp);

.
Lệnh fpassthru($fp); tương đương với 2 lệnh:

PHP Code:
$content = fread($handle, filesize($filename));
echo $content;

Như vậy chương trình này cũng không có gì khác với các chương trình PHP thông thường ngoài 2 lệnh header(). Trong đó lệnh

PHP Code:
header("Content-length: " . filesize($filename));

cũng không có gì là khó hiểu, lệnh này báo cho browser biết dung lượng của file chuẩn bị download (thực ra không có lệnh này thì quá trình download vẫn diễn ra như bình thường). Vấn đề mấu chốt nằm ở lệnh

PHP Code:
header("Content-type: application/octet-stream");

.
Lệnh

PHP Code:
header("Content-type: application/octet-stream");

sẽ báo cho browser biết là dữ liệu chuẩn bị load xuống là dữ liệu nhị phân. Vì là dữ liệu nhị phân nên browser sẽ thực hiện quá trình download và save file thay vì hiển thị lên browser như là 1 trang HTML thông thường.
Thử chạy ví dụ trên vài lần, thay thế file document.zip bằng một số file khác nhau (ví dụ file Word, PDF, Excel…) và thử trên vài browser khác nhau, bạn sẽ nhận thấy có vài chỗ hơi khó chịu:

  • Browser sẽ mặc định lưu file lên đĩa với tên là download.php. Bạn phải đổi tên file lại cho đúng trước khi mở file ra đọc.
  • Trong một số trường hợp, thay vì hỏi save file lên đĩa, browser sẽ mở luôn file (ví dụ chạy Word hoặc Acrobat mở luôn file vừa được download).

Để giải quyết 2 vấn đề khó chịu trên cũng không có gì khó khăn lắm, ta chỉ cần thêm 1 lệnh header() nữa:

PHP Code:
header('Content-disposition: attachment; filename="'.$filename.'"');

Tham số “attachment” của header “Content-disposition” sẽ báo cho browser biết là nên download và save file thay vì open. Tham số “filename=” sẽ báo cho browser biết tên của file đang được download. CẢI TIẾN CHƯƠNG TRÌNH
Cho tới bây giờ chương trình của chúng ta vẫn còn thô sơ, chúng ta vẫn cần them vào chức năng nữa để chương trình hoàn thiện hơn.

  • Cho phép người dùng chọn file để download. Hiện tại chương trình của chúng ta chỉ mới cho phép download 1 file duy nhất.
  • Kiểm tra dữ liệu nhập từ người dùng. Đây là một việc luôn nên làm. Chương trình cho phép nguời dùng chọn file để download thì cũng cần nên kiểm tra kỹ kẻo chính file config, file source hoặc file password của bạn bị download thì phiền.

Cho phép người dùng chọn file để download: Thao tác này có lẽ khá đơn giản đối với bạn. Chương trình sẽ nhận vào tham số file từ URL (ví dụ: download.php?file=document.zip). Đoạn code xử lý như sau:

PHP Code:
$filename = isset($_GET['file'])?$_GET['file']:'';

—————————————————————
——————-> BỔ SUNG BÀI VIẾT<——————–
—————————————————————
Kiểm tra dữ liệu nhập: Ta cần kiểm tra các điều kiện sau:

  • File có tồn tại và được phép đọc hay không? PHP cung cấp sẵn cho ta 2 hàm ls is_file() và is_readable() để làm việc này:
    PHP Code:
    if ( $filename == "" || !is_file($filename) || !is_readable($filename) ) {
    echo "Error: ...";
    exit(-1);
    }

    Đoạn mã trên sẽ kiểm tra nếu như tên file là rỗng, hoặc file không tồn tại hoặc không đọc được thì sẽ báo lỗi và thoát.

  • Tên file có chứa các ký tự đặt biệc hay không? Thường các file upload sẽ được để trong 1 thư mục riêng. Như vậy tên file chỉ có thể chứa các ký tự a-z, 0-9, gạch ngang (-), gạch dưới (_), khoảng trắng và dấu chấm (.). Ta có thể xem như các kỹ tự khác trong tên file là không hợp lệ. Đoạn mã kiểm tra như sau:
    PHP Code:
    if ( !preg_match('/^[a-z0-9\_\-\. ]*$/i', $filename) ) {
    echo "Error: ...";
    exit(-1);
    }

    Đoạn mã trên sẽ kiểm tra nếu như trong file có chứa ký tự lạ (không phải là 0-9, a-z, gach dưới, gạch ngang, khoảng trắng, dấu chấm, khoảng trắng thì sẽ báo lỗi) và thoát chương trình. Ngoài ra, có một số file cấu hình đặt biệc của server được bắt đầu bằng dấu chấm (ví dụ .htaccess, .htpasswd), ta cũng phải kiểm tra xem ksy tự đầu tiên của tên file có phải là dấu chấm hay không, nói cách khác, ký tự đầu tiên của tên file phải là 1 chữ cái (a-z) hoặc chữ số (0-9) hoặc kỹ tự gạch ngang hoặc gạch dưới. Lệnh if trên được cài tiến lại như sau:

    PHP Code:
    if ( !preg_match('/^[a-z0-9\_\-][a-z0-9\_\-\. ]*$/i', $filename) ) {
    echo "Error: ...";
    exit(-1);
    }

Giép lại ta có chương trình được cải tiến như sau:

PHP Code:
<?php
//các file upload được để trong 1 thư mục riêng
$upload_dir = "../upload/";

//lấy tên file cần download từ URL
$filename = isset($_GET['file'])?$_GET['file']:'';

//thực hiện quá trình kiểm tra
if ( !preg_match('/^[a-z0-9\_\-][a-z0-9\_\-\. ]*$/i', $filename) )
|| !is_file($upload_dir.$filename) || !is_readable($upload_dir.$filename) ) {
echo "Loi: Ten file khong hop le hoac file khong ton tai!";
exit(-1);
} //end if

//mở file để đọc với chế độ nhị phân (binary)
$fp = fopen($upload_dir.$filename, "rb");

//gởi header đến cho browser
header('Content-type: application/octet-stream');
header('Content-disposition: attachment; filename="'.$filename.'"');
header('Content-length: ' . filesize($upload_dir.$filename));

//đọc file và trả dữ liệu về cho browser
fpassthru($fp);
fclose($fp);

Lưu ý rằng ta không cần kiểm tra tên file rỗng nữa vì ở trên ta đã kiểm tra ký tự đầu tiên của tên file, nên nếu tên file lã rỗng thì sẽ không có ký tự đầu tiên, do vậy điều kiện kiểm tra của hàm pregg_match sẽ bị sai rồi. THẮC MẮC NHỎ CUỐI CÙNG
Tới đây xem như chương trình của chúng ta xem như là đã hoàn chỉnh. Tuy nhiên, có thể bạn sẽ còn một thắc mắc nho nhỏ: ngoài kiểu dữ liệu application/octet-stream thì còn kiểu dữ liệu nào khác không? và mặc định thì PHP sẽ dùng kiểu dữ liệu gì để trả về cho browser?
Mặc định PHP sẽ trả về dữ liệu kiểu text/html cho browser. Một số kiểu dữ liệu tương ứng với các kiểu file thông dụng:
.GIF: image/gif
.JPG: image/jpeg
.PNG: image/png
.WAV: audio/wav
.MP3: audio/mpeg3
.DOC: application/msword
.PDF: application/pdf
Tuỳ vào kiểu của dữ liệu trả về mà browser có thể sẽ có những cách ứng khác nhau. Ví dụ nếu dữ liệu trả về là file ảnh thì browser sẽ hiển thị luôn, nếu là file nhạc thì browser sẽ gọi WMP lên để play, nếu là file PDF thì chương trình Acrobat sẽ được gọi…
Kiểu application/octet-stream để chỉ dữ liệu nhị phân (binary) chung chung. Nếu bạn chỉ muốn browser download và save file thì bạn chỉ cần trả về kiểu dữ liệu application/octet-stream là đủ.

Nguồn :  sinhvienit.net

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s