Cách list multiple lists trong Python
21/12/2022 01:28
Tìm hiểu cách lặp qua nhiều danh sách cạnh nhau trong Python – mỗi lần một phần tử. Những kỹ thuật này sẽ hoạt động ngay cả khi danh sách có độ dài khác nhau!
Vòng lặp qua danh sách là một trong những kỹ năng cơ bản nhất trong Python. Trong một số trường hợp, bạn có thể thấy mình phải lặp lại nhiều danh sách cạnh nhau, lấy một phần tử từ mỗi danh sách và thực hiện thao tác với nó. Nếu bạn là người mới sử dụng Python, thì không phải lúc nào bạn cũng rõ ràng về cách thực hiện điều đó hoặc những cảnh báo và phương pháp hay nhất tồn tại cho tác vụ này.
Trong bài viết này, chúng ta sẽ tìm hiểu cách tốt nhất để lặp qua nhiều danh sách trong Python. Chúng ta sẽ bắt đầu với một vòng lặp for đơn giản, tìm hiểu cách lặp qua nhiều danh sách một cách “thủ công”, sau đó khám phá tính hữu ích của các hàm zip và zip_longest. Bạn nên làm quen một chút với CÁC TRÌNH TỰ NHƯ BỘ DỮ LIỆU VÀ DANH SÁCH và có HIỂU BIẾT CƠ BẢN VỀ CÁCH THỨC HOẠT ĐỘNG CỦA VÒNG LẶP . Nếu bạn cần xem lại, hãy xem các bài viết được liên kết để biết một số gợi ý. Nếu không, chúng ta hãy bắt đầu!
Vòng lặp qua danh sách trong Python
Hãy tóm tắt lại cách lặp qua một danh sách trong Python. Cách đơn giản nhất là sử dụng vòng lặp for để duyệt qua từng phần tử của danh sách. Đây là một ví dụ:
animals = [ "cat" , "dog" , "monkey" ] for animal in animals: print (animal) # output: # cat # dog # monkey |
Vòng for
lặp đi qua từng con vật trong animals
danh sách, đặt nó vào một biến có tên là con vật, rồi in ra.
Một khả năng khác là truy cập trực tiếp từng phần tử trong danh sách bằng cách sử dụng chỉ mục của nó. Thông thường, điều này liên quan đến việc tạo một dải số có độ dài bằng với danh sách (biến n trong ví dụ bên dưới), lặp qua dải đó, sau đó sử dụng từng số làm chỉ mục của từng thành phần trong danh sách.
Đây là giao diện của nó:
animals = [ "cat" , "dog" , "monkey" ] n = len (animals) for i in range (n): animal = animals[i] print (animal) # output: # cat # dog # monkey |
Bất chấp sự khác biệt về cú pháp, lần lặp này mang lại kết quả chính xác như trước đây. Vì nó phức tạp hơn một chút, nên animal in animals
vòng lặp for thường được ưu tiên hơn khi tất cả những gì bạn cần là lặp qua một danh sách.
Vòng lặp thủ công qua nhiều danh sách trong Python
Cho đến nay, các vòng lặp đã đủ dễ dàng. Nhưng điều gì sẽ xảy ra nếu chúng ta có nhiều danh sách để lặp lại?
Sự cố này xuất hiện khi chúng tôi có dữ liệu liên quan nhưng được lưu trữ trong các danh sách khác nhau. Ví dụ: hãy xem xét hai danh sách bên dưới students
và grades
:
students = [ "John" , "Mary" , "Luke" ] grades = [ 9.0 , 8.5 , 7.5 ] |
Mặc dù chúng là các danh sách riêng biệt, nhưng chúng có liên quan với nhau theo chỉ mục: John
(phần tử đầu tiên trong students
danh sách) có điểm 9.0
(phần tử đầu tiên trong grades
danh sách), Mary có 8.5
, v.v. Làm thế nào chúng ta có thể lặp lại cả hai danh sách và in ra từng học sinh cùng với điểm tương ứng của họ?
Một giải pháp là sử dụng phép lặp dựa trên chỉ mục mà chúng tôi đã sử dụng trước đây. Nếu chúng ta sử dụng cùng một chỉ mục để lấy một phần tử từ mỗi danh sách, chúng ta sẽ nhận được cặp giá trị thích hợp. Đây là giao diện của nó:
students = [ "John" , "Mary" , "Luke" ] grades = [ 9.0 , 8.5 , 7.5 ] n = len (students) for i in range (n): student = students[i] grade = grades[i] print (student, "got a grade of" , grade) # output: # John got a grade of 9.0 # Mary got a grade of 8.5 # Luke got a grade of 7.5 |
Như bạn có thể thấy, mỗi học sinh được in cùng với điểm của họ. Ngoài ra, lưu ý cách danh sách được sử dụng khi tính n không thực sự quan trọng. Nó sẽ hoạt động như cũ nếu chúng ta viết n = len(grades)
thay thế.
Vấn đề với việc sử dụng các chỉ số
Nhưng chờ đã - có một nhược điểm! Điều gì xảy ra nếu danh sách students
và grades
không có cùng kích thước? Trong trường hợp đó, những điều khác nhau sẽ xảy ra, tùy thuộc vào việc bạn sử dụng danh sách ngắn hơn hay dài hơn để tạo chỉ mục.
Nếu danh sách ngắn hơn được cung cấp, thì vòng lặp sẽ kết thúc trước khi các phần tử bổ sung của danh sách dài hơn được truy cập. Trong ví dụ bên dưới, hãy lưu ý cách lớp cuối cùng không được truy cập:
students = [ "John" , "Mary" ] grades = [ 9.0 , 8.5 , 7.5 ] n = len (students) for i in range (n): student = students[i] grade = grades[i] print (student, "got a grade of" , grade) # output: # John got a grade of 9.0 # Mary got a grade of 8.5 |
Mặt khác, nếu danh sách dài hơn được sử dụng để tính n, thì mã cuối cùng sẽ chạy vào an IndexError
khi cố gắng lấy một phần tử từ danh sách ngắn hơn:
students = [ "John" , "Mary" , "Luke" , "Anna" ] grades = [ 9.0 , 8.5 , 7.5 ] n = len (students) for i in range (n): student = students[i] grade = grades[i] print (student, "got a grade of" , grade) # output: # John got a grade of 9.0 # Mary got a grade of 8.5 # Luke got a grade of 7.5 # IndexError: list index out of range |
Khi i
là 3, students[i]
trở thành students[3]
và trả về phần tử "Anna"
. Tuy nhiên, trong cùng một lần lặp đó, không có phần tử nào tồn tại cho grades[3]
. Điều này dẫn đến kết quả IndexError
đã thấy ở trên.
Sử dụng chức năng zip để tự động lặp lại nhiều danh sách
Có một giải pháp thay thế đơn giản hơn nhiều để lặp qua nhiều danh sách trong Python: zip
hàm. Đây là một chức năng tích hợp sẵn cho phép bạn lặp lại hai hoặc nhiều danh sách cạnh nhau.
So sánh ví dụ dưới đây với mã trước đây của chúng tôi và lưu ý rằng nó trông đơn giản và đẹp hơn nhiều:
students = [ "John" , "Mary" , "Luke" ] grades = [ 9.0 , 8.5 , 7.5 ] for student, grade in zip (students, grades): print (student, "got a grade of" , grade) # output: # John got a grade of 9.0 # Mary got a grade of 8.5 # Luke got a grade of 7.5 |
Bằng cách sử dụng zip
hàm, chúng ta không cần lo lắng về việc lưu trữ độ dài của danh sách trong một biến như n
hoặc lấy các phần tử theo cách thủ công bằng cách sử dụng chỉ mục i
. Chúng tôi chỉ cần đặt các danh sách mà chúng tôi muốn lặp lại vào zip
hàm và để Python lo lắng về các chi tiết. Ngoài ra, hãy lưu ý cách các biến student
và điểm tham chiếu đến các phần tử bên trong mỗi danh sách được chuyển đến zip
hàm theo cùng một thứ tự.
Bạn cũng có thể sử dụng hàm Python zip
để lặp lại nhiều hơn hai danh sách cạnh nhau. Đơn giản chỉ cần đặt tất cả chúng vào zip
hàm, sau đó sử dụng cùng một số lượng biến trong vòng lặp for để lưu trữ các phần tử tương ứng của mỗi danh sách:
students = [ "John" , "Mary" , "Luke" ] ages = [ 12 , 10 , 13 ] grades = [ 9.0 , 8.5 , 7.5 ] for student, age, grade in zip (students, ages, grades): print (student, "is" , age, "years old and got a grade of" , grade) # output: # John is 12 years old and got a grade of 9.0 # Mary is 10 years old and got a grade of 8.5 # Luke is 13 years old and got a grade of 7.5 |
Sử dụng hàm zip_longest để tiếp cận tất cả các phần tử trong nhiều danh sách trong Python
Còn những danh sách có số lượng phần tử khác nhau trong mỗi danh sách thì sao? Chà, zip
hành vi của hàm chỉ đơn giản là dừng lặp lại sau khi tất cả các phần tử trong danh sách ngắn nhất được truy cập. Ví dụ: vòng lặp bên dưới chỉ thực hiện một lần vì danh sách sinh viên chỉ có một mục duy nhất trong đó:
students = [ "John" ] ages = [ 12 , 10 , 13 ] grades = [ 9.0 , 8.5 , 7.5 ] for student, age, grade in zip (students, ages, grades): print (student, "is" , age, "years old and got a grade of" , grade) # output: # John is 12 years old and got a grade of 9.0 |
Nếu bạn muốn truy cập tất cả các phần tử trong tất cả các danh sách, bạn có thể sử dụng zip_longest
chức năng này để thay thế. Hàm này nằm trong itertools
module đi kèm với thư viện chuẩn của Python nên chúng ta chỉ cần import là có thể sử dụng được.
Như tên cho thấy, zip_longest
hàm này hoạt động giống như zip
hàm thông thường, nhưng nó tiếp cận tất cả các phần tử – ngay cả những phần tử trong danh sách dài nhất. Để làm điều đó, nó sẽ điền vào các giá trị trong danh sách ngắn hơn với giá trị mặc định. Đây là cách nó hoạt động:
from itertools import zip_longest students = [ "John" , "Mary" , "Luke" ] ages = [ 12 , 10 ] grades = [ 9.0 ] for student, age, grade in zip_longest(students, ages, grades, fillvalue = "??" ): print (student, "is" , age, "years old and got a grade of" , grade) # output: # John is 12 years old and got a grade of 9.0 # Mary is 10 years old and got a grade of ?? # Luke is ?? years old and got a grade of ?? |
Như bạn có thể thấy, mặc dù độ tuổi và cấp của danh sách ngắn hơn students
, nhưng chúng tôi đã lặp lại trên tất cả các phần tử của students
. Để làm được điều đó, các danh sách ngắn hơn được thêm vào một “giá trị điền” trong vòng lặp. Theo mặc định, giá trị Không được sử dụng làm giá trị điền, nhưng ở đây chúng tôi đã sử dụng chuỗi "??"
để định dạng đẹp hơn. Khá tiện dụng!
Kết thúc các vòng lặp Python, zip và zip_longest
Như chúng ta đã thấy, hàm zip
và zip_longest
thực sự hữu ích khi bạn cần lặp qua nhiều danh sách trong Python. Với các chức năng này, bạn không phải lo lắng về các chỉ số và kích thước danh sách và có thể tập trung vào chính quá trình lặp. Hãy nhớ rằng: sử dụng zip
khi bạn muốn vòng lặp của mình dừng lại sau khi danh sách ngắn nhất đã hết; sử dụng zip_longest
nếu bạn muốn truy cập mọi phần tử trong danh sách dài hơn.