× Giới thiệu Lịch khai giảng Tin tức Sản phẩm học viên

Split trong Python - Hé lộ cách sử dụng hàm Split trong Python

05/06/2021 01:18

(Split trong Python) Python là ngôn ngữ lập trình có nhiều kiểu dữ liệu khác nhau trong đó bao gồm các chuỗi - string. Mặc dù chuỗi là một thành phần bất biến, chúng ta vẫn có thể thực hiện thao tác trên một chuỗi string sử dụng hàm split. Hàm này sẽ chia nhỏ các chuỗi lớn thành các chuỗi nhỏ hơn sử dụng các tham số khác nhau. Trong bài viết này ta sẽ tìm hiểu cách sử dụng hàm split trong Python.

Split trong lập trình là gì?

Split trong Python

Split trong Python

Chuỗi trong Python đại diện cho các giá trị ký tự unicode. Python không có kiểu dữ liệu ký tự, vì vậy kiểu ký tự đơn cũng được coi là một chuỗi. 

Chúng ta sử dụng các ngoặc đơn  hoặc ngoặc đôi để khai báo dữ liệu. Để truy cập một chuỗi, chúng ta sử dụng chỉ mục và dấu ngoặc vuông. Vì các chuỗi là các thành phần bất biến nên chúng ta không thể thực hiện thay đổi sau khi đã khai báo chúng.

Ví dụ:

name = "Edureka"

print(name[0])

Output: E

Mặc dù không thể thay đổi chuỗi sau khi thực hiện khai báo, ta vẫn có thể chia tách chuỗi string trong Python.

>>> Xem ngay: Khóa học lập trình python cam kết việc làm

Nhu cầu sử dụng hàm Split trong Python

Hàm Split trả lại danh sách của chuỗi sau khi chia các chuỗi này dựa vào các dấu phân tách đã cho. Một số lợi ích của việc chia hàm trong Python là:

  • Tại một thời điểm nào đó, ta sẽ cần phải chia chuỗi lớn thành các đoạn hoặc chuỗi nhỏ hơn
  • Các khoảng trắng được coi là dấu phân cách nếu không có dấu cách nào được cấp trong hàm split
  • Việc phân tích và đưa ra kết luận trở nên dễ dàng hơn
  • Giải mã các chuỗi được mã hóa

Làm thế nào để sử dụng hàm Split trong Python

Như đã nói, hàm Split sẽ chia nhỏ một chuỗi lớn hơn và đưa ra một danh sách có các phần hoặc chuỗi nhỏ hơn. Dưới đây là ví dụ tách chuỗi trong Python:

a = "We are Edureka, we have cutting edge tutorials and certification programs to upskill your knowledge"

print(a.split())

Output: 

[ 'We' , 'are' , 'Edureka' , 'we' , 'have' , 'cutting' , 'edge' , 'tutorials' , 'and' , 'certification' , 'programs' , 'to' , 'upskill' , 'your' , 'knowledge']

 

Phía trên là một ví dụ đơn giản để thể hiện cách các hàm split có thể được sử dụng để chia nhỏ toàn bộ đoạn text thành các chuỗi nhỏ hơn. Nhưng hàm split có các tham số khác nhau để tối ưu hóa việc thực thi.

>>> Đọc thêm: Đa xử lý trong Python - Hé lộ cách tốt nhất để thực hiện đa xử lý

Tham số của Split trong Python

Separator: Đóng vai trò như dấu tách, chuỗi được chia nhỏ. Separator cũng là tùy chọn, nếu không có dấu phân tách được chỉ định, dấu phân cách mặc định sẽ là khoảng trắng.

Dưới đây là ví dụ hàm split với tham số separator:

a = "Edureka is the biggest edtech company, it has many cutting edge courses to learn"

print(a.split(" , ")

b = "Sunday*Monday*Tuesday*Wednesday*Thursday*Friday*Saturday"

print(a.split(" * ")

Output:

[ ' Edureka is the biggest edtech company' , 'it has many cutting edge courses to learn' ]

['Sunday' , 'Monday' , 'Tuesday' , 'Wednesday' , 'Thursday

Trong  ví dụ trên, separator được chỉ định theo đó đó chuỗi được chia thành các chuỗi nhỏ hơn.

>>> Đọc thêm: CGI trong Python - Giải mã kiến thức về CGI trong Python

Tham số Max

Max - cũng là tùy chọn. Nó xác định số lần chia tách sẽ diễn ra. Giá trị mặc định là -1 có nghĩa là không có giới hạn về số lượng tách. 

Dưới đây là ví dụ để hiển thị hàm phân tách với tham số tối đa:

a = "my*name*is*python"

print(a.split(" * " , 3)

Đầu ra:  

['my', 'name', 'is', 'python']

Tham số max trong ví dụ trên được đặt thành 3, có nghĩa là đầu ra sẽ có 4 phần tử trong danh sách các chuỗi.

Ví dụ:

Dưới đây là một vài ví dụ, nơi chúng ta có thể sử dụng hàm phân tách để chia chuỗi thành các đoạn hoặc chuỗi nhỏ hơn.

Output:

[ 'my' , 'name' , 'is' , 'python' ]

['Cat' , 'Dog' , 'Ant' , 'Car' , 'Tap' ]

['python' , 'was' , 'made' , 'by' , 'Guido' , 'van' , 'rossum' ]

['this' , 'will' , 'be' , 'in' , 'output' ]
a = "my name is python"

print(a.split())

 

b = "CatDogAntCarTap"

print([b[ i : i+3] for i in range(0 , len(b) , 3)])

 

c = "python#was#made#by#Guido#van#rossum"

print(c.split(" #", 6)

 

d = " this , will , be , in , output, this will be not"

print(d.split(" , " , 4)

Trong bài viết này, chúng ta đã tìm hiểu cách sử dụng hàm phân tách để chia nhỏ các chuỗi lớn thành các đoạn hoặc chuỗi nhỏ hơn. Chuỗi là một cấu trúc dữ liệu bất biến có nghĩa là nó không thể thay đổi khi bạn đã khai báo. Mặc dù thao tác có thể được thực hiện bằng cách sử dụng chức năng tách. Ngôn ngữ lập trình Python có các kiểu dữ liệu khác nhau như danh sách , từ điển , tuple ,,....

Tìm hiểu thêm về Python và các ngôn ngữ lập trình khác qua các khóa học lập trình tại Viện công nghệ thông tin T3H.