Basic data types in Python
How are data types in Python: string, number, list, tuple, set and dictionary used? Let's find out with TipsMake.com.com!
How are data types in Python: string, number, list, tuple, set and dictionary used? Let's find out with TipsMake!
Data types are ways of classifying data items. It represents a type of value that indicates what operations can be performed on a particular data. Since everything is an object in Python programming, data types are actually classes, and variables are objects of these classes.
Python has many different data types. If you want to program good applications, you should definitely know them.
When taking tests, you easily come across questions like in python, what is the output of the following function? float(' -12345 ') note: the number of spaces before the number is 5… So how to answer these questions accurately? The answer is very simple. That is, you must master Python data types.
Python is a special programming language with many data types that help you create a useful program. Some of the most common data types are:
- Integer: is a type of scalar numeric data, such as 1, 2, 3, 4, 5.
- Real number (float): is a type of numeric data with a decimal point, such as 1.5, 2.7, 3.14.
- String: is a data type containing a string of characters, such as "hello", "goodbye".
- Boolean: is a data type with two values: True or False.
- List: is a data type containing a set of values, for example [1, 2, 3, 4, 5].
- Dictionary: is a data type that contains key-value pairs, for example {"name": "John", "age": 30}.
For example, you can use a function type
to check the data type of a variable as follows:
x = 1 print(type(x)) # in ra " " y = 1.5 print(type(y)) # in ra " " z = "hello" print(type(z)) # in ra " "
Because the article will list the most important contents of all data types in Python, it will be quite long. Each data type comes with specific examples for you to easily visualize.
Be sure to save this Python Documentation page to update the latest articles. Don't forget to do the Python exercises to reinforce your knowledge.
1. Variables in Python
A variable is a location in memory used to store data (value). Variables are given unique names to distinguish between different memory locations. The rules for writing a variable name are the same as the rules for writing identifiers in Python.
In Python, you don't need to declare a variable before using it, just assign the variable a value and it will exist. There is also no need to declare the variable type, the variable type will be automatically determined based on the value you assigned to the variable.
Assign value to variable:
To assign a value to a variable we use the = operator. Any type of value can be assigned to a valid variable.
For example:
hoa = "Hồng" la = 3 canh = 5.5
Above are 3 assignment statements, " Hong " is a string of characters, assigned to a capital variable , 3 is an integer and assigned to la , 5.5 is a decimal number and assigned to canh .
Assign multiple values:
In Python you can assign multiple values in one command like this:
hoa, la, canh = "Hồng", 3, 5.5
If you want to assign the same value to multiple variables, you can write the command as follows:
hoa, la, canh = 3
The above command will assign the value 3 to all 3 variables: hoa, la and canh.
2. Numeric data type in Python
Numeric data types in Python
Python supports integers, decimals, and complex numbers, which are respectively defined as int, float, and complex classes in Python. Integers and decimal numbers are distinguished by the presence or absence of a decimal point.
For example: 5 is an integer, 5.0 is a decimal number. Python also supports complex numbers and uses the suffix j
or J
to indicate the imaginary part. For example: 3+5j
. In addition to int
and float
, Python supports two more types of numbers: Decimal
and Fraction
.
We will use functions type()
to check to see which numeric class a variable or value belongs to, and functions isinstance()
to check if they belong to a specific class.
a = 9 # Output: print(type(a)) # Output: print(type(5.0)) # Output: (10+2j) b = 8 + 2j print(b + 2) # Kiểm tra xem b có phải là số phức không # Output: True print(isinstance(b, complex))
Integers in Python are not limited in length, decimals are limited to 16 numbers after the decimal point.
The numbers we work with every day are usually base 10, but computer programmers (usually embedded programmers) need to work with binary, hexadecimal and octal number systems. To represent these coefficients in Python, we place an appropriate prefix before the number.
Coefficient prefix for Python numbers:
Number system | Prefix |
Binary system | '0b' or '0B' |
Octal system | '0o' or '0O' |
Hexadecimal system | '0x' or '0X' |
(You can put the prefix without the ' ').
This is an example of using coefficient prefixes in Python, and when we use the function print()
to print their value to the screen, we will get the corresponding number in the coefficient of 10.
# Output: 187 print(0b10111011) # Output: 257 (250 + 7) print(0xFA + 0b111) # Output: 15 print(0o17)
Convert between numeric types in Python
We can convert one number type to another number type. This is also known as coercion. Operations such as addition and subtraction will implicitly convert integers to decimals (automatically) if there is an operator in the operation that is a decimal number.
For example : If you perform addition between the integer 2 and the decimal number 3.0, then 2 will be forcibly converted to decimal 2.0 and the returned result will be decimal 5.0.
>>> 2 + 3.0 5.0
We can use built-in Python functions like int()
, float()
and complex()
to convert between numeric types explicitly. These functions can even convert from strings.
>>> int(3.6) 3 >>> int(-1.2) -1 >>> float(7) 7.0 >>> complex('2+8j') (2+8j)
When converting from decimal to integer, the number will be omitted, only the integer part will be taken.
Decimal module in Python
The class float built into Python may surprise us a bit. Normally, if we calculate the sum of 1.1 and 2.2, we think the result will be 3.3, but that seems not to be the case. If you check the correctness of this math operation in Python, the result will be False.
>>> (1.1 + 2.2) == 3.3 False
What happened?
This is because, decimal numbers are implemented in computer hardware as binary fractions, since computers only understand binary numbers (0 and 1) so most of the decimal fractions we know , cannot be stored correctly in the computer.
For example, we cannot represent the fraction 1/3 as a decimal, because it is an infinite repeating decimal, with the numbers after the decimal point infinitely long, so we can only evaluate it. .
When converting the decimal part 0.1, it results in an infinitely long binary part of 0.000110011001100110011. and the computer only stores a finite part of the number after the . its only. Therefore, the number stored is only approximately 0.1 and never equal to 0.1. That's why the addition we talked about above doesn't give the results we expected. That is a limitation of computer hardware, not Python's fault.
Now try typing the above addition into Python to see what the return result is:
>>> 1.1+2.2 3.3000000000000003
To overcome this problem, we can use the Decimal module in Python. While float numbers only take 16 numbers after the decimal point, the Decimal module allows customizing the length of the number.
import decimal # Output: 0.1 print(0.1) # Output: 0.1000000000000000055511151231257827021181583404541015625 print(decimal.Decimal(0.1))
This module is used when we want to perform mathematical operations in decimal numbers to get results like we learned in school.
This is also quite important, for example 25.50kg will be more accurate than 25.5kg, because 2 decimal places are still more accurate than 1 digit.
from decimal import Decimal # Output: 3.3 print(Decimal('1.1') + Decimal('2.2')) # Output: 10.000 print(Decimal('4.0') * Decimal('2.50'))
If you want more concise code, you can import the Decimal module and change the module name to D.
from decimal import Decimal as D # Output: 3.3 print(D('1.1') + D('2.2')) # Output: 10.000 print(D('4.0') * D('2.50'))
In this code we import the Decimal module and change its name to D, the result is unchanged from the above code.
You may wonder in the multiplication section, why not use Decimal numbers to multiply but have to add 0 after 4 and 2.5. The answer is efficiency, float operations are performed faster than Decimal operations.
When should Decimal be used instead of float?
We often use Decimal in the following cases:
- When creating financial applications, precise decimal representation is essential.
- When you want to control the precision of numbers.
- When you want to perform math operations like you learned in school.
Fractions in Python
Python provides mathematical operations involving fractions through the fractions module. A fraction has a numerator and a denominator, both of which are integers. We can create Fraction objects in many different ways:
import fractions # Tạo phân số từ số thập phân print(fractions.Fraction(4.5)) # Output: 9/2 # Tạo phân số từ số nguyên # Code by TipsMake print(fractions.Fraction(9)) # Output: 9 # Tạo phân số bằng cách khai báo tử, mẫu số print(fractions.Fraction(2,5)) # Output: 2/5
When creating fractions from floats, we may get unusual results, which is due to computer hardware limitations as discussed in the decimal module section.
In particular, you can initialize a fraction from string. This is the preferred initialization when using decimal numbers.
import fractions # Khởi tạo phân số từ float print(fractions.Fraction(0.1)) # Output: 3602879701896397/36028797018963968 # Khởi tạo phân số từ string # Code by TipsMake print(fractions.Fraction('0.1')) # Output: 1/10
The fraction data type fully supports basic mathematical operations such as addition, subtraction, multiplication, division, and logic:
# Output: 1 print(F(2,5) + F(3,5)) # Output: 3/5 print(F(2,5) + F(1,5)) # Output: 7/1 print(1 / F(3,7)) # Output: False print(F(-2,9) > 0) # Output: True print(F(-2,9) < 0)
Mathematics in Python
Python provides math and random modules to solve other mathematical problems such as trigonometry, logarithms, probability and statistics, etc. Because the math module has quite a lot of functions and properties, I calculated Will make a separate post to list them. Below is an example of math in Python.
from fractions import Fraction as F import math # Output: 3.141592653589793 print(math.pi) # Output: -1.0 print(math.cos(math.pi)) # Output: 22026.465794806718 print(math.exp(10)) # Output: 2.0 print(math.log2(4)) # Output: 1.1752011936438014 print(math.sinh(1)) # Output: 40320 print(math.factorial(8))
Use the interpreter as a calculator
The interpreter works like a simple calculator: You can enter a calculation and it writes out the value. The expression syntax is quite simple: operators like +, -, * and / work the same as in most other programming languages (Pascal, C), parentheses () can be used for grouping . For example:
>>> 2 + 2 4 >>> 50 - 5*6 20 >>> (50 - 5*6) / 4 5.0 >>> 8 / 5 # phép chia luôn trả về một số dạng thập phân với dấu chấm 1.6
Integers (like 2
, 4
, 20
) have type int
, decimal numbers (like 5.0
, 1.6
) have type float
.
Division ( /
) always returns a float. To perform integer division (removing numbers after the decimal point) you can use the operator //
; To calculate the remainder, use %
the example below:
>>> 17 / 3 # phép chia thường trả về số thập phân 5.666666666666667 >>> >>> 17 // 3 # phép chia lấy số nguyên, loại bỏ phần sau dấu thập phân 5 >>> 17 % 3 # toán tử % trả về số dư của phép chia 2 >>> 5 * 3 + 2 # thương * số chia + số dư 17
With Python, you can use operators **
to calculate exponents:
>>> 5 ** 2 # 5 bình phương 25 >>> 2 ** 7 # 2 mũ 7 128
The equal sign =
is used to assign a value to a variable. Then no results are displayed before the next command prompt:
>>> width = 20 >>> height = 5 * 9 >>> width * height 900
If a variable is not defined (assigned a value), try to use it and you will receive the following error:
>>> n # bạn đang cố truy cập vào biến n chưa được gán giá trị Traceback (most recent call last): File "", line 1, in NameError: name 'n' is not defined
Python fully supports floating point, calculations with both integers and decimals, the result will be returned as a decimal number (sic: operators with mixed type operands convert integer operands to decimal):
>>> 4 * 3.75 - 1 14.0
In interactive mode, the last printed expression will be assigned to the variable _
, making it easier to perform subsequent calculations. For example:
>>> tax = 12.5 / 100 >>> price = 100.50 >>> price * tax 12.5625 >>> price + _ 113.0625 >>> round(_, 2) 113.06
You should consider this variable as read-only, do not assign a value to it - because if you create a variable with the same name it will take over this default variable and no longer be able to do the cool things above.
3. String
String in Python is a sequence of characters. Computers don't deal with characters, they only work with binary numbers. Although you can see characters on the screen, they are stored and processed internally as combinations of 0s and 1s. Converting characters to numbers is called encoding, and the process is the reverse. is called decoding. ASCII and Unicode are two of the popular encodings commonly used.
In Python, a string is a sequence of Unicode characters. Unicode covers every character in all languages and provides uniformity in encoding.
How to create strings in Python
Besides numbers, Python can also manipulate strings, represented in many ways. '.'
They can be enclosed in single ( ) or double ( ) quotes "."
with the same result. is used to "escape" these two quotes.
>>> 'spam eggs' # dấu nháy đơn 'spam eggs' >>> 'doesn't' # sử dụng ' để viết dấu nháy đơn. "doesn't" >>> "doesn't" # .hoặc sử dụng dấu nháy kép "doesn't" >>> '"Yes," he said.' '"Yes," he said.' >>> ""Yes," he said." '"Yes," he said.' >>> '"Isn't," she said.' '"Isn't," she said.'
In the interactive interpreter, the resulting string includes the quotation marks and special characters that are "hidden" using . Although the output may look slightly different from the input (enclosing quotes may vary), the two strings are equivalent. Strings are written in double quotes when the string contains single quotes and no double quotes), otherwise it is written in single quotes. The print() function creates a more readable output string, by ignoring the accompanying quotes and printing special characters that "escape" the quotes:
>>> '"Isn't," she said.' '"Isn't," she said.' >>> print('"Isn't," she said.') "Isn't," she said. >>> s = 'First line.nSecond line.' # n nghĩa là dòng mới >>> s # không có print(), n sẽ được viết trong kết quả đầu ra 'First line.nSecond line.' >>> print(s) # có print(), n sẽ tạo ra dòng mới First line. Second line.
If you do not want the characters added by to be interpreted as special characters by the interpreter, use the raw string by prefixing the
r
first quote:
>>> print('C:somename') # ở đây n là dòng mới! C:some ame >>> print(r'C:somename') # thêm r trước dấu nháy C:somename
String characters can be written on multiple lines using three quotes: """."""
or '''.'''
. Line endings are automatically included in the string, but this can be prevented by appending to the end of the line. For example:
print(""" Usage: thingy [OPTIONS] -h Display this usage message -H hostname Hostname to connect to """)
Here is the result (the original newline is not counted):
Here is a list of all escape sequences supported by Python:
Escape Sequence | Describe |
---|---|
newline | Backslashes and newlines are ignored |
Backslash | |
' | Apostrophe |
" | Quotation marks |
a | ASCII Bell |
b | ASCII Backspace |
f | ASCII Formfeed |
n | ASCII Linefeed |
r | ASCII Carriage Return |
t | ASCII Horizontal Tab |
v | ASCII Vertical Tab |
ooo | The character with octal value is ooo |
xHH | The character with hexadecimal value is HH |
For example: Let's run each command individually right in the compiler to see the results.
>>> print("C:Python32TipsMake.com") C:Python32TipsMake.com >>> print("In dòng nàynthành 2 dòng") In dòng này thành 2 dòng >>> print("In giá trị x48x45x58") In giá trị HEX >>>
How to access elements of a string
Strings can be indexed with the first character numbered 0. There is no separate character type, each character is simply a number:
>>> word = 'Python' >>> word[0] # ký tự ở vị trí số 0 'P' >>> word[5] # ký tự ở vị trí số 5 'n'
The index can also be negative, starting from the right:
>>> word[-1] # last character 'n' >>> word[-2] # second-last character 'o' >>> word[-6] 'P'
Note that because -0 is the same as 0, negative indices start at -1.
In addition to numbering, slicing is also supported. While index is used to get individual characters, slicing will allow you to get substrings:
>>> word[0:2] # các ký tự từ vị trí 0 (bao gồm) đến 2 (loại trừ) 'Py' >>> word[2:5] # các ký tự từ vị trí 2 (bao gồm) đến 5 (loại trừ) 'tho'
Pay attention to how characters are retained and excluded. It always ensures that s[:i] + s[i:]
by s
:
>>> word[:2] + word[2:] 'Python' >>> word[:4] + word[4:] 'Python'
The indices in string slicing have a pretty useful default setting, there are 2 indices that are ignored by default, which are 0 and the size of the string to be cut.
>>> word[:2] # các ký tự từ đầu đến vị trí thứ 2 (loại bỏ) 'Py' >>> word[4:] # các ký tự từ vị trí thứ 4(lấy) đến hết 'on' >>> word[-2:] # các ký tự thứ hai tính từ cuối lên (lấy) đến hết 'on'
Another way to remember how string slicing works is to visualize the subscripts as separators between characters, with the leftmost character numbered 0. Then, the last character on the right, in A string of n characters will have index n, for example:
+---+---+---+---+---+---+ | P | y | t | h | o | n | +---+---+---+---+---+---+ 0 1 2 3 4 5 6 -6 -5 -4 -3 -2 -1
The first row of numbers gives the position of the index from 0 to 6 in the string. The second row is the corresponding negative indices. Cutting from i to j will include all characters between i and j, respectively.
For non-negative indices, the length of a slice is the difference of the indices, if both are within the bounds. For example, the length of word[1:3] is 2.
Attempting to use an index that is too large will return an error:
>>> word[42] # từ chỉ có 6 ký tự Traceback (most recent call last): File "", line 1, in IndexError: string index out of range
However, indexes outside the slice range are still handled neatly when used for slicing:
>>> word[4:42] # cắt ký tự từ vị trí thứ 4 đến 42 'on' >>> word[42:] # cắt ký tự sau vị trí 42 ''
Change or delete a string
Python strings cannot change - they are fixed. Therefore, if you intentionally assign a certain character to an indexed location, you will receive an error message:
>>> word[0] = 'J' . TypeError: 'str' object does not support item assignment >>> word[2:] = 'py' . TypeError: 'str' object does not support item assignment
If another string is needed, it's best to create a new one:
>>> 'J' + word[1:] 'Jython' >>> word[:2] + 'py' 'Pypy'
You cannot delete or remove characters from a string, but like a tuple, you can delete an entire string, using the del keyword:
qtm_string = 'TipsMake.com' del qtm_string # Output: NameError: name 'qtm_string' is not defined qtm_string
String concatenation
Strings can be concatenated using the operator +
and replaced with *
:
>>> # thêm 3 'un' vào sau 'ium' >>> 3 * 'un' + 'ium' 'unununium'
Two or more string characters (i.e. characters within quotation marks) next to each other are automatically concatenated.
>>> 'Py' 'thon' 'Python'
The above feature only works with literal strings, does not apply to variables or expressions:
>>> prefix = 'Py' >>> prefix 'thon' # không thể nối một biến với một chuỗi . SyntaxError: invalid syntax >>> ('un' * 3) 'ium' . SyntaxError: invalid syntax
If you want to concatenate variables together or variables with strings, use +
:
>>> prefix + 'thon' 'Python'
This feature is especially useful when you want to break long strings into shorter strings:
>>> text = ('Put several strings within parentheses ' . 'to have them joined together.') >>> text 'Put several strings within parentheses to have them joined together.'
If you want to concatenate strings in different lines, use parentheses:
>>> # sử dụng () >>> s = ('Xin ' . 'chào!') >>> s 'Xin chào!'
Iterate and check elements of the string
Like lists and tuples, you also use a for loop when you need to iterate over a string, like in the example below to count the number of "i" characters in the string:
count = 0 for letter in 'TipsMake.com': if(letter == 'i'): count += 1 # Output: Có 1 chữ i được tìm thấy print('Có', count,'chữ i được tìm thấy')
To check whether a substring is present in a string, use the in keyword, like this:
>>> 'TipsMake' in 'TipsMake.com' True >>> 'python' in 'TipsMake.com' False >>>
Built-in Python function for working with strings
There are two most commonly used functions when working with strings in Python: enumerate() and len().
Function len()
built into Python, which returns the length of the string:
>>> s = 'supercalifragilisticexpialidocious' >>> len(s) 34
The enumerate() function returns an enumeration object, containing the value pair and index of the element in the string, quite useful during iteration.
qtm_str = 'Python' # enumerate() qtm_enum = list(enumerate(qtm_str)) # Output: list(enumerate(qtm_str) = [(0, 'P'), (1, 'y'), (2, 't'), (3, 'h'), (4, 'o'), (5, 'n')] print('list(enumerate(qtm_str) = ', qtm_enum)
format() method to format the string
The format() method is very flexible and powerful when used to format strings. String format containing {} as a placeholder or replacement field to receive an alternative value. You can also use positional arguments or keywords to specify the order.
# default(implicit) order thu_tu_mac_dinh = "{}, {} và {}".format('Quản','Trị','Mạng') print('n--- Thứ tự mặc định ---') print(thu_tu_mac_dinh) # sử dụng đối số vị trí để sắp xếp thứ tự vi_tri_thu_tu= "{1}, {0} và {2}".format('Quản','Trị','Mạng') print('n--- Thứ tự theo vị trí ---') print(vi_tri_thu_tu) # sử dụng từ khóa để sắp xếp thứ tự tu_khoa_thu_tu = "{s}, {b} và {j}".format(j='Quản',b='Trị',s='Mạng') print('n--- Thứ tự theo từ khóa ---') print(tu_khoa_thu_tu)
We have the following result when running the above code:
--- Thứ tự mặc định --- Quản, Trị và Mạng --- Thứ tự theo vị trí --- Trị, Quản và Mạng --- Thứ tự theo từ khóa --- Mạng, Trị và Quản
The format() method can have optional format specifications. They are separated from the field name by a :. For example, it is possible to left-align <, right-align >, or center ^ a string in the given space. Can format integers as binary or hexadecimal numbers; Decimal numbers can be rounded or displayed as an exponent. There are many formats you can use.
>>> # Định dạng số nguyên >>> "Khi chuyển {0} sang nhị phân sẽ là {0:b}".format(12) 'Khi chuyển 12 sang nhị phân sẽ là 1100' >>> # Định dạng số thập phân >>> "Số thập phân {0} ở dạng mũ sẽ là {0:e}".format(1566.345) 'Số thập phân 1566.345 ở dạng mũ sẽ là 1.566345e+03' >>> # Làm tròn số thập phân >>> "1 phần 3 là: {0:.3f}".format(1/3) '1 phần 3 là: 0.333' >>> # căn chỉnh chuỗi >>> "|{:<10}|{:^10}|{:>10}|".format('Quản','Trị','Mạng') '|Quản | Trị | Mạng|'
Old-style string format:
You can format a string in Python to the sprintf() style used in the C programming language using the %.
>>> x = 15.1236789 >>> print('Giá trị của x là %3.2f' %x) Giá trị của x là 15.12 >>> print('Giá trị của x là %3.4f' %x) Giá trị của x là 15.123712.3457
The method is commonly used in string
There are many built-in methods in Python for working with strings. In addition to format() mentioned above, there are also lower(), upper(), join(), split(), find(), replace(), etc.
>>> "QuanTriMang.Com".lower() 'TipsMake.com' >>> "QuanTriMang.Com".upper() 'QUANTRIMANG.COM' >>> "Quan Tri Mang Chấm Com".split() ['Quan', 'Tri', 'Mang', 'Chấm', 'Com'] >>> ' '.join(['Quan', 'Tri', 'Mang', 'Chấm', 'Com']) 'Quan Tri Mang Chấm Com'' >>> 'Quan Tri Mang Chấm Com'.find('Qua') 0 >>> 'Quan Tri Mang Chấm Com'.replace('Chấm','.') 'Quan Tri Mang . Com'
4. List (list)
Python provides a series of complex data, often called sequences, used to group different values. The most versatile is the list.
How to create lists in Python
In Python, a list is represented by a sequence of values, separated by commas, enclosed in []. Lists can contain multiple items of different types, but typically the items are of the same type.
>>> squares = [1, 4, 9, 16, 25] >>> squares [1, 4, 9, 16, 25]
List không giới hạn số lượng mục, bạn có thể có nhiều kiểu dữ liệu khác nhau trong cùng một list, như chuỗi, số nguyên, số thập phân,.
list1 = [] # list rỗng list2 = [1, 2, 3] # list số nguyên list3 = [1, "Hello", 3.4] # list với kiểu dữ liệu hỗn hợp
Bạn cũng có thể tạo các list lồng nhau (danh sách chứa trong danh sách), ví dụ:
a = ['a', 'b', 'c'] n = [1, 2, 3] x = [a, n] print (x) # Output: [['a', 'b', 'c'], [1, 2, 3]] print (x[0]) # Output: ['a', 'b', 'c'] print(x[0][1]) # Output: b
Hoặc khai báo list lồng nhau từ đầu:
list4 = [mouse", [8, 4, 6], ['a']]
Truy cập vào phần tử của list
Có nhiều cách khác nhau để truy cập vào phần tử của một danh sách:
Index (chỉ mục) của list:
Sử dụng toán tử index [] để truy cập vào một phần tử của list. Index bắt đầu từ 0, nên một list có 5 phần tử sẽ có index từ 0 đến 4. Truy cập vào phần tử có index khác index của list sẽ làm phát sinh lỗi IndexError. Index phải là một số nguyên, không thể sử dụng float, hay kiểu dữ liệu khác, sẽ tạo lỗi TypeError.
qtm_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # TypeError: list indices must be integers or slices, not float # TypeError: index của list phải là số nguyên hoặc slice, không phải số thập phân qtm_list[2.0]
List lồng nhau có thể truy cập bằng index lồng nhau:
qtm_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Output: q print(qtm_list[0]) # Output: a print(qtm_list[2]) # Output: t print(qtm_list[4]) # List lồng nhau ln_list = ["Happy", [1,3,5,9]] # Index lồng nhau # Output: a print(ln_list[0][1]) # Output: 9 print(ln_list[1][3])
Index âm:
Python cho phép lập chỉ mục âm cho các chuỗi. Index -1 là phần tử cuối cùng, -2 là phần tử thứ 2 từ cuối cùng lên. Nói đơn giản là index âm dùng khi bạn đếm phần tử của chuỗi ngược từ cuối lên đầu.
qtm_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Code by TipsMake # Output: m print(qtm_list[-1]) # Output: i print(qtm_list[-9])
Cắt lát (slice) list trong Python
Python cho phép truy cập vào một dải phần tử của list bằng cách sử dụng toán tử cắt lát : (dấu hai chấm). Mọi hành động cắt list đều trả về list mới chứa những yếu tố được yêu cầu.
qtm_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Code by TipsMake # Output: ['u', 'a', 'n', 't'] print(qtm_list[1:5]) # Output: ['q', 'u', 'a', 'n', 't', 'r', 'i'] print(qtm_list[:-8]) # Output: ['n', 'g', '.', 'c', 'o', 'm'] print(qtm_list[9:])
Để cắt lát list, bạn chỉ cần sử dụng dấu : giữa 2 index cần lấy các phần tử. [1:5] sẽ lấy phần tử 1 đến 5, [:-8] lấy từ 0 đến phần tử -8,.
Nếu thực hiện hành động cắt sau thì nó sẽ trả về một list mới là bản sao của list ban đầu:
qtm_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Output: ['q', 'u', 'a', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g', '.', 'c', 'o', 'm'] print(qtm_list[:])
Thay đổi hoặc thêm phần tử vào list
List cũng hỗ trợ các hoạt động như nối list:
>>> squares + [36, 49, 64, 81, 100] [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
Không giống như chuỗi, bị gán cố định, list là kiểu dữ liệu có thể thay đổi. Ví dụ, bạn có thể thay đổi các mục trong list:
>>> cubes = [1, 8, 27, 65, 125] # có vẻ sai sai >>> 4 ** 3 # lập phương của 4 là 64, không phải 65! 64 >>> cubes[3] = 64 # thay thế giá trị sai >>> cubes [1, 8, 27, 64, 125]
Bạn cũng có thể cho thêm mục mới vào cuối list bằng cách sử dụng các phương thức, chẳng hạn như append():
>>> cubes.append(216) # thêm lập phương của 6 >>> cubes.append(7 ** 3) # và lập phương của 7 >>> cubes [1, 8, 27, 64, 125, 216, 343]
Việc gán cho lát cũng có thể thực hiện và thậm chí có thể thay đổi cả kích thước của list hay xóa nó hoàn toàn:
>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g'] >>> letters ['a', 'b', 'c', 'd', 'e', 'f', 'g'] >>> # thay thế vài giá trị >>> letters[2:5] = ['C', 'D', 'E'] >>> letters ['a', 'b', 'C', 'D', 'E', 'f', 'g'] >>> # giờ thì xóa chúng >>> letters[2:5] = [] >>> letters ['a', 'b', 'f', 'g'] >>> # xóa list bằng cách thay tất cả các phần tử bằng một list rỗng >>> letters[:] = [] >>> letters []
Hàm len() cũng có thể áp dụng với list:
>>> letters = ['a', 'b', 'c', 'd'] >>> len(letters) 4
Xóa hoặc loại bỏ phần tử khỏi list trong Python
Bạn có thể xóa một hoặc nhiều phần tử khỏi list sử dụng từ khóa del, có thể xóa hoàn toàn cả list.
my_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # xóa phần tử có index là 2 del my_list[2] # Output: ['q', 'u', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g', '.', 'c', 'o', 'm'] print(my_list) # xóa phần tử có index từ 1 đến 7 del my_list[1:7] # Output: ['q', 'a', 'n', 'g', '.', 'c', 'o', 'm'] print(my_list) # xóa toàn bộ list my_list del my_list # Error: NameError: name 'my_list' is not defined print(my_list)
Bạn cũng có thể sử dụng remove() để loại bỏ những phần tử đã cho hoặc pop() để loại bỏ phần tử tại một index nhất định. pop() loại bỏ phần tử và trả về phần tử cuối cùng nếu index không được chỉ định. Điều này giúp triển khai list dưới dạng stack (ngăn xếp) (cấu trúc dữ liệu first in last out - vào đầu tiên, ra cuối cùng).
Ngoài ra, phương thức clear() cũng được dùng để làm rỗng một list (xóa tất cả các phần tử trong list).
my_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] my_list.remove('.') # Output: ['q', 'u', 'a', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g', 'c', 'o', 'm'] print(my_list) # Output: n print(my_list.pop(3)) # Output: ['q', 'u', 'a', 't', 'r', 'i', 'm', 'a', 'n', 'g', 'c', 'o', 'm'] print(my_list) # Output: m print(my_list.pop()) # Output: ['q', 'u', 'a', 't', 'r', 'i', 'm', 'a', 'n', 'g', 'c', 'o'] print(my_list) my_list.clear() # Output: [] (list rỗng) print(my_list)
Cách cuối cùng để xóa các phần tử trong một list là gán một list rỗng cho các lát phần tử.
>>> my_list = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] >>> my_list[11:15]=[] >>> my_list ['q', 'u', 'a', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g']
Phương thức list trong Python
Những phương thức có sẵn cho list trong Python gồm:
- append(): Thêm phần tử vào cuối list.
- extend(): Thêm tất cả phần tử của list hiện tại vào list khác.
- insert(): Chèn một phần tử vào index cho trước.
- remove(): Xóa phần tử khỏi list.
- pop(): Xóa phần tử khỏi list và trả về phần tử tại index đã cho.
- clear(): Xóa tất cả phần tử của list.
- index(): Trả về index của phần tử phù hợp đầu tiên.
- count(): Trả về số lượng phần tử đã đếm được trong list như một đối số.
- sort(): Sắp xếp các phần tử trong list theo thứ tự tăng dần.
- reverse(): Đảo ngược thứ tự các phần tử trong list.
- copy(): Trả về bản sao của list.
Ví dụ:
QTM = [9,8,7,6,8,5,8] # Output: 2 print(QTM.index(7)) # Output: 3 print(QTM.count(8)) QTM.sort() # Output: [5, 6, 7, 8, 8, 8, 9] print(QTM) QTM.reverse() # Output: [9, 8, 8, 8, 7, 6, 5] print(QTM)
Ví dụ 2:
QTM = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Output: 3 print(QTM.index('n')) # Output: 2 print(QTM.count('a')) QTM.sort() # Output: ['.', 'a', 'a', 'c', 'g', 'i', 'm', 'm', 'n', 'n', 'o', 'q', 'r', 't', 'u'] print(QTM) QTM.reverse() # Output: ['u', 't', 'r', 'q', 'o', 'n', 'n', 'm', 'm', 'i', 'g', 'c', 'a', 'a', '.'] print(QTM)
List comprehension: Cách tạo list mới ngắn gọn
List comprehension là một biểu thức đi kèm với lệnh for được đặt trong cặp dấu ngoặc vuông [].
Ví dụ:
cub3 = [3 ** x for x in range(9)] # Output: [1, 3, 9, 27, 81, 243, 729, 2187, 6561] print(cub3)
Code trên tương đương với:
cub3 = [] for x in range (9): cub3.append(3**x) print(cub3)
Ngoài for, if cũng có thể được sử dụng trong một list comprehension của Python. Lệnh if có thể lọc các phần tử trong list hiện tại để tạo thành list mới. Dưới đây là ví dụ:
cub3 = [3 ** x for x in range(9) if x > 4] # Output: [243, 729, 2187, 6561] print(cub3) so_le = [x for x in range (18) if x % 2 == 1] # Output: [1, 3, 5, 7, 9, 11, 13, 15, 17] print(so_le) noi_list = [x+y for x in ['Ngôn ngữ ','Lập trình '] for y in ['Python','C++']] # Output: ['Ngôn ngữ Python', 'Ngôn ngữ C++', 'Lập trình Python', 'Lập trình C++'] print(noi_list)
Kiểm tra phần tử có trong list không
Sử dụng keyword in để kiểm tra xem một phần tử đã có trong list hay chưa. Nếu phần tử đã tồn tại, kết quả trả về là True, và ngược lại sẽ trả về False.
QTM = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Output: True print('q' in QTM) # Output: True print('.' in QTM) # Output: False print('z' in QTM)
Vòng lặp for trong list
Sử dụng vòng lặp for để lặp qua các phần tử trong list như ví dụ dưới đây:
for ngon_ngu in ['Python','Java','C']: print("Tôi thích lập trình",ngon_ngu)
Kết quả trả về sẽ như sau:
Tôi thích lập trình Python Tôi thích lập trình Java Tôi thích lập trình C
Các hàm Python tích hợp với list
Các hàm Python tích hợp sẵn như all(), any(), enumerate(), len(), max(), min(), list(), sorted(),. thường được sử dụng với list để thực hiện những nhiệm vụ khác nhau.
- all(): Trả về giá trị True nếu tất cả các phần tử của list đều là true hoặc list rỗng.
- any(): Trả về True khi bất kỳ phần tử nào trong list là true. Nếu list rỗng hàm trả về giá trị False.
- enumerate(): Trả về đối tượng enumerate, chứa index và giá trị của tất cả các phần tử của list dưới dạng tuple.
- len(): Trả về độ dài (số lượng phần tử) của list.
- list(): Chuyển đổi một đối tượng có thể lặp (tuple, string, set, dictionary) thành list.
- max(): Trả về phần tử lớn nhất trong list.
- min(): Trả về phần tử nhỏ nhất trong list.
- sorted(): Trả về list mới đã được sắp xếp.
- sum(): Trả về tổng của tất cả các phần tử trong list.
5. Tuple
Tuple trong Python là một chuỗi các phần tử có thứ tự giống như list. Sự khác biệt giữa list và tuple là chúng ta không thể thay đổi các phần tử trong tuple khi đã gán, nhưng trong list thì các phần tử có thể thay đổi.
Tuple thường được sử dụng cho các dữ liệu không cho phép sửa đổi và nhanh hơn list vì nó không thể thay đổi tự động. Một tuple được định nghĩa bằng dấu ngoặc đơn (), các phần tử trong tuple cách nhau bằng dấu phẩy (,).
Ví dụ:
t = (10, "quan tri mang", 2j)
Bạn có thể sử dụng toán tử cắt [] để trích xuất phần tử trong tuple nhưng không thể thay đổi giá trị của nó.
t = (10, "quan tri mang", 2j) #t[0:2] = (10, 'quan tri mang') print("t[0:2] = ", t[0:2])
Chạy code trên ta được kết quả:
t[0:2] = (10, 'quan tri mang')
Tuple hơn list ở điểm nào?
Vì tuple và list khá giống nhau, nên chúng thường được sử dụng trong những tình huống tương tự nhau. Tuy nhiên, tuple vẫn có những lợi thế nhất định so với list, như:
- Tuple thường được sử dụng cho các kiểu dữ liệu không đồng nhất (khác nhau) và list thường sử dụng cho các kiểu dữ liệu (đồng nhất) giống nhau.
- Vì tuple không thể thay đổi, việc lặp qua các phần tử của tuple nhanh hơn so với list. Vì vậy, trong trường hợp này tuple chiếm ưu thế về hiệu suất hơn list một chút.
- Tuple chứa những phần tử không thay đổi, có thể được sử dụng như key cho dictionary. Với list, điều này không thể làm được.
- Nếu có dữ liệu không thay đổi việc triển khai nó như một tuple sẽ đảm bảo rằng dữ liệu đó được bảo vệ chống ghi (write-protected).
Tạo một tuple
Tuple được tạo bằng cách đặt tất cả các phần tử của nó trong dấu ngoặc đơn (), phân tách bằng dấu phẩy. Bạn có thể bỏ dấu ngoặc đơn nếu muốn, nhưng nên thêm nó vào cho code rõ ràng hơn.
Tuple không bị giới hạn số lượng phần tử và có thể có nhiều kiểu dữ liệu khác nhau như số nguyên, số thập phân, list, string,.
# Tuple rỗng # Output: () my_tuple = () print(my_tuple) # tuple số nguyên # Output: (2, 4, 16, 256) my_tuple = (2, 4, 16, 256) print(my_tuple) # tuple có nhiều kiểu dữ liệu # Output: (10, "TipsMake.com", 3.5) my_tuple = (10, "TipsMake.com", 3.5) print(my_tuple) # tuple lồng nhau # Output: ("QTM", [2, 4, 6], (3, 5, 7)) my_tuple = ("QTM", [2, 4, 6], (3, 5, 7)) print(my_tuple) # tuple có thể được tạo mà không cần dấu () # còn gọi là đóng gói tuple # Output: (10, "TipsMake.com", 3.5) my_tuple = 10, "TipsMake.com", 3.5 print(my_tuple) # mở gói (unpacking) tuple cũng có thể làm được # Output: # 10 # TipsMake # 3.5 a, b, c = my_tuple print(a) print(b) print(c)
Tạo tuple chỉ có một phần tử hơi phức tạp chút, nếu bạn tạo theo cách thông thường là cho phần tử đó vào trong cặp dấu () là chưa đủ, cần phải thêm dấu phẩy để chỉ ra rằng, đây là tuple.
# tạo tuple chỉ với () # Output: my_tuple = ("TipsMake.com") print(type(my_tuple)) # khi thêm dấu phẩy vào cuối # Output: my_tuple = ("TipsMake.com",) print(type(my_tuple)) # dấu () là tùy chọn, bạn có thể bỏ nếu thích # Output: my_tuple = "TipsMake.com", print(type(my_tuple))
Truy cập vào các phần tử của tuple
Có nhiều cách khác nhau để truy cập vào các phần tử của một tuple, khá giống với list, nên mình không lấy ví dụ cụ thể, các bạn có thể xem lại phần list nha.
Index: Sử dụng toán tử index [] để truy cập vào phần tử trong tuple với index bắt đầu bằng 0. Nghĩa là nếu tuple có 6 phần tử thì index của nó sẽ bắt đầu từ 0 đến 5. Nếu cố gắn truy cập đến index 6, 7 thì sẽ tạo lỗi IndexError. Index bắt buộc phải là số nguyên, mà không thể là số thập phân hay bất kỳ kiểu dữ liệu nào khác, nếu không sẽ tạo lỗi TypeError. Những tuple lồng nhau được truy cập bằng cách sử dụng index lồng nhau:
# tuple lồng nhau n_tuple = ("TipsMake.com", [2, 6, 8], (1, 2, 3)) # index lồng nhau # Output: 'r' print(n_tuple[0][5]) # index lồng nhau # Output: 8 print(n_tuple[1][2])
Index âm: Python cho phép lập chỉ mục âm cho các đối tượng dạng chuỗi. Index -1 tham chiếu đến phần tử cuối cùng, -2 là thứ 2 tính từ cuối tính lên.
Cắt lát: Có thể truy cập đến một loạt phần tử trong tuple bằng cách sử dụng toán tử cắt lát : (dấu 2 chấm).
Thay đổi một tuple
Không giống như list, tuple không thể thay đổi. Điều này có nghĩa là các phần tử của một tuple không thể thay đổi một khi đã được gán. Nhưng, nếu bản thân phần tử đó là một kiểu dữ liệu có thể thay đổi (như list chẳng hạn) thì các phần tử lồng nhau có thể được thay đổi. Chúng ta cũng có thể gán giá trị khác cho tuple (gọi là gán lại - reassignment).
my_tuple = (1, 3, 5, [7, 9]) # không thể thay đổi phần tử của tuple # Nếu bạn bỏ dấu # ở dòng 8 # Bạn sẽ nhận được lỗi: # TypeError: 'tuple' object does not support item assignment #my_tuple[1] = 9 # Nhưng phần tử có index 3 trong tuple là list # list có thể thay đổi, nên phần tử đó có thể thay đổi # Output: (1, 3, 5, [8, 9]) my_tuple[3][0] = 8 print(my_tuple) # Nếu cần thay đổi tuple hãy gán lại giá trị cho nó # Output: ('q', 'u', 'a', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g') my_tuple = ('q', 'u', 'a', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g') print(my_tuple)
Bạn có thể dùng toán tử + để nối 2 tuple, toán tử * để lặp lại tuple theo số lần đã cho. Cả + và * đều cho kết quả là một tuple mới.
# Nối 2 tuple # Output: (2, 4, 6, 3, 5, 7) print((2, 4, 6) + (3, 5, 7)) # Lặp lại tuple # Output: ('TipsMake.com', 'TipsMake.com', 'TipsMake.com') print(("TipsMake.com",) * 3)
Xóa tuple
Các phần tử trong tuple không thể thay đổi nên chúng ta cũng không thể xóa, loại bỏ phần tử khỏi tuple. Nhưng việc xóa hoàn toàn một tuple có thể thực hiện được với từ khóa del như dưới đây:
QTM = ('q','u','a','n','t','r','i','m','a','n','g','.','c','o','m') # Không thể xóa phần tử của tuple # Nếu bạn chạy lệnh del QTM[3] # sẽ tạo ra lỗi: # TypeError: 'tuple' object doesn't support item deletion # Có thể xóa toàn bộ tuple del QTM # Sau đó thử chạy print (QTM) sẽ trả về lỗi # NameError: name 'QTM' is not defined
Phương thức và hàm dùng với tuple trong Python
Phương thức thêm phần tử và xóa phần tử không thể sử dụng với tuple, chỉ có 2 phương thức sau là dùng được:
- count(x): Đếm số phần tử x trong tuple.
- index(x): Trả về giá trị index của phần tử x đầu tiên mà nó gặp trong tuple.
QTM = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Count # Output: 2 print(QTM.count('m')) # Index # Output: 3 print(QTM.index('n'))
Các hàm dùng trong tuple khá giống với list, gồm có:
- all(): Trả về giá trị True nếu tất cả các phần tử của tuple là true hoặc tuple rỗng.
- any(): Trả về True nếu bất kỳ phần tử nào của tuple là true, nếu tuple rỗng trả về False.
- enumerated(): Trả về đối tượng enumerate (liệt kê), chứa cặp index và giá trị của tất cả phần tử của tuple.
- len(): Trả về độ dài (số phần tử) của tuple.
- max(): Trả về phần tử lớn nhất của tuple.
- min(): Trả về phần tử nhỏ nhất của tuple.
- sorted(): Lấy phần tử trong tuple và trả về list mới được sắp xếp (tuple không sắp xếp được).
- sum(): Trả về tổng tất cả các phần tử trong tuple.
- tuple(): Chuyển đổi những đối tượng có thể lặp (list, string, set, dictionary) thành tuple.
Kiểm tra phần tử trong tuple
Bạn có thể kiểm tra xem một phần tử đã tồn tại trong tuple hay chưa với từ khóa in.
QTM = ['q','u','a','n','t','r','i','m','a','n','g','.','c','o','m'] # Kiểm tra phần tử # Output: True print('a' in QTM) # Output: False print('b' in QTM) # Not in operation # Output: False print('g' not in QTM)
Lặp qua các phần tử của tuple trong Python
Sử dụng vòng lặp for để lặp qua các phần tử trong tuple.
for ngon_ngu in ('Python','C++','Web'): print("Tôi thích lập trình",ngon_ngu)
Kết quả trả về sẽ như sau:
Tôi thích lập trình Python Tôi thích lập trình C++ Tôi thích lập trình Web
6. Set
Set trong Python là tập hợp các phần tử duy nhất, không có thứ tự. Các phần tử trong set phân cách nhau bằng dấu phẩy và nằm trong dấu ngoặc nhọn {}. Nhớ kỹ rằng các phần tử trong set không có thứ tự. Nhưng các phần tử trong set có thể thay đổi, có thể thêm hoặc xóa phần tử của set. Set có thể được sử dụng để thực hiện các phép toán như tập hợp, giao,.
Cách tạo set
Set được tạo bằng cách đặt tất cả các phần tử trong dấu ngoặc nhọn, phân tách bằng dấu phẩy hoặc sử dụng hàm set(). Set không giới hạn số lượng phần tử, nó có thể chứa nhiều kiểu biến khác nhau, nhưng không thể chứa phần tử có thể thay đổi được như list, set hay dictionary.
Ví dụ về set:
a = {5,2,3,1,4}
Nếu thực hiện lệnh in như sau:
print("a=", a)
Bạn sẽ nhận được kết quả:
a = {1, 2, 3, 4, 5}
Set với nhiều kiểu dữ liệu hỗn hợp như sau:
my_set = {1.0, "Xin chào", (1, 2, 3)} #Output: QTM_Set= {'Xin chào', 1.0, (1, 2, 3)} print("QTM_Set=",my_set)
Tạo set rỗng có chút khó khăn. Cặp dấu {} sẽ tạo một dictionary trong Python. Để tạo set không có phần tử nào, ta sử dụng hàm set() mà không có đối số nào.
# initialize a with {} qtm = {} # Kiểm tra kiểu dữ liệu của qtm # Output: print(type(qtm)) # Khởi tạo qtm với set() qtm = set() # Kiểm tra kiểu dữ liệu của qtm # Output: print(type(qtm))
Làm sao để thay đổi set trong Python
Vì set là tập hợp các phần tử không có thứ tự nên chỉ mục chả có ý nghĩa gì với set. Do đó toán tử cắt [] sẽ không làm việc trên set. Nếu cố tình dùng, bạn sẽ nhận được thông báo lỗi như dưới đây:
>>> a[1] Traceback (most recent call last): File " ", line 1, in a[1] TypeError: 'set' object does not support indexing
Để thêm một phần tử vào set, bạn sử dụng add() và để thêm nhiều phần tử dùng update(). Update() có thể nhận tuple, list, strring và set làm đối số. Trong mọi trường hợp, Set có giá trị duy nhất, các bản sao sẽ tự động bị loại bỏ.
# Khởi tạo my_set my_set = {1,3} print(my_set) # Nếu bỏ dấu # ở dòng 9, # Bạn sẽ nhận được lỗi # TypeError: 'set' object does not support indexing #my_set[0] # Thêm phần tử # Output: {1, 2, 3} my_set.add(2) print(my_set) # Thêm nhiều phần tử vào set # Output: {1, 2, 3, 4} my_set.update([2,3,4]) print(my_set) # Thêm list và set # Output: {1, 2, 3, 4, 5, 6, 8} my_set.update([4,5], {1,6,8}) print(my_set)
Xóa phần tử khỏi set
Bạn dùng discard() và remove() để xóa phần tử cụ thể khỏi set. Khi phần tử cần xóa không tồn tại trong set thì discard() không làm gì cả, còn remove() sẽ báo lỗi.
# Khởi tạo my_set my_set = {1, 3, 4, 5, 6} print(my_set) # Xóa phần tử bằng discard() # Output: {1, 3, 5, 6} my_set.discard(4) print(my_set) # Xóa bằng remove() # Output: {1, 3, 5} my_set.remove(6) print(my_set) # Xóa phần tử không có # trong set bằng discard() # Output: {1, 3, 5} my_set.discard(2) print(my_set) # Xóa phần tử không có # trong set bằng remove() # Nếu bạn bỏ dấu # ở dòng 27, # bạn sẽ nhận được lỗi. # Output: KeyError: 2 #my_set.remove(2)
Bạn có thể xóa và trả lại một mục bằng phương thức pop(). Set không có thứ tự, không có cách nào để xác định phần tử nào sẽ bị xóa, điều này diễn ra hoàn toàn ngẫu hứng. Việc xóa hoàn toàn set được thực hiện bằng cách dùng clear().
# Khởi tạo my_set # Output: set of unique elements my_set = set("TipsMake.com") print(my_set) # xóa phần tử bằng pop() # Output: phần tử bị xóa ngẫu nhiên print(my_set.pop()) # xóa phần tử khác bằng pop() # Output: phần tử bị xóa ngẫu nhiên my_set.pop() print(my_set) # clear my_set #Output: set() my_set.clear() print(my_set)
Các toán tử set trong Python
Set thường được sử dụng để chứa các toán tử tập hợp như hợp, giao, hiệu, bù. Có cả phương thức và toán tử để thực hiện những phép toán tập hợp này.
Ta sẽ sử dụng 2 tập hợp dưới đây:
>>> A = {1, 2, 3, 4, 5} >>> B = {4, 5, 6, 7, 8}
Hợp của A và B là tập hợp tất cả các phần tử của A và B. Hợp được biểu diễn bằng cách sử dụng toán tử | hoặc sử dụng phương thức union().
# Khởi tạo A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # sử dụng toán tử | # Output: {1, 2, 3, 4, 5, 6, 7, 8} print(A | B) # sử dụng hàm union() # Output: Như trên print(A.union(B)) print(B.union(A))
Giao của A và B là tập hợp những phần tử chung của A và B. Để tìm giao của A và B ta có thể dùng toán tử & hoặc hàm intersection().
# khởi tạo A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # sử dụng & # Output: {4, 5} print(A & B) # sử dụng intersection() # Output: {4, 5} print(A.intersection(B)) print(B.intersection(A))
Hiệu của A và B (A-B) là tập hợp phần tử chỉ có trong A, không có trong B. Hiệu của B và A (B-A) là tập hợp phần tử chỉ có trong B không có trong A. Có thể sử dụng toán tử - hoặc hàm difference() để thực hiện phép toán tập hợp này.
# Khởi tạo A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # Sử dụng toán tử - trên A # Output: {1, 2, 3} print(A - B) # Sử dụng hàm difference() trên A # Output: {1, 2, 3} print(A.difference(B)) # Sử dụng toán tử - trên B # Output: {8, 6, 7} print(B - A) # Sử dụng difference() trên B # Output: {8, 6, 7} print(B.difference(A))
Bù của A và B là tập hợp những phần tử có trong A và B nhưng không phải phần tử chung của hai tập hợp này. Bạn có thể dùng toán tử ^ hoặc hàm symmetric_difference() để thực hiện phép bù.
# Khởi tạo A và B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # Sử dụng toán tử ^ # Output: {1, 2, 3, 6, 7, 8} print(A ^ B) # Sử dụng symmetric_difference() trên A # Output: {1, 2, 3, 6, 7, 8} print(A.symmetric_difference(B))
Các phương thức dùng trên set
Phương thức | Mô tả |
add() | Thêm một phần tử vào set. |
clear() | Xóa tất cả phần tử của set. |
copy() | Trả về bản sao chép của set. |
difference() | Trả về set mới chứa những phần tử khác nhau của 2 hay nhiều set. |
difference_update() | Xóa tất cả các phần tử của set khác từ set này. |
discard() | Xóa phần tử nếu nó có mặt trong set. |
intersection() | Trả về set mới chứa phần tử chung của 2 set. |
intersection_update() | Cập nhật set với phần tử chung của chính nó và set khác. |
isdisjoint() | Trả về True nếu 2 set không có phần tử chung. |
issubset() | Trả về True nếu set khác chứa set này. |
issuperset() | Trả về True nếu set này chưa set khác. |
pop() | Xóa và trả về phần tử ngẫu nhiên, báo lỗi KeyError nếu set rỗng. |
remove() | Xóa phần tử từ set. Nếu phần tử đó không có trong set sẽ báo lỗi KeyError. |
symmetric_difference() | Trả về set mới chứa những phần tử không phải là phần tử chung của 2 set. |
symmetric_difference_update() | Cập nhật set với những phần tử khác nhau của chính nó và set khác. |
union() | Trả về set mới là hợp của 2 set. |
update() | Cập nhật set với hợp của chính nó và set khác. |
Kiểm tra phần tử trong set
Bạn có thể kiểm tra một đối tượng xem nó có nằm trong set không, sử dụng từ khóa in.
# Khởi tạo my_set my_set = set("TipsMake.com") # Kiểm tra xem Q có trong my_set không # Output: True print('Q' in my_set) # Kiểm tra xem q có trong my_set không # Output: False print('q' in my_set)
Lặp qua phần tử của set
Sử dụng vòng lặp for để lặp qua các phần tử của set.
for letter in set("Python"): print(letter)
Chạy code trên bạn nhận được kết quả như sau:
t y P h o n
Hàm thường dùng trên set
Các hàm thường dùng trên set bao gồm all(), any(), enumerate(), len(), max(), min(), sorted(), sum(). Chức năng của những hàm này khá giống với khi bạn sử dụng trên list, tuple, bạn có thể tham khảo thêm nếu chưa rõ nha.
Hàm | Mô tả |
all() | Trả về True nếu tất cả thành phần của set đều là true (hoặc nếu set là empty). |
any() | Trả về True nếu phần tử bất kỳ được thiết lập là true. Nếu set là empty, trả về False . |
enumerate() | Trả về một đối tượng liệt kê. Nó chứa chỉ mục và giá trị cho tất cả các mục của tập hợp dưới dạng một cặp. |
len() | Trả về độ dài (số của các mục) trong set. |
max() | Trả về mục lớn nhất trong set. |
min() | Trả về mục nhỏ nhất trong set. |
sorted() | Trả về danh sách đã phân loại mới từ phần tử trong set (không tự sắp xếp set đó) |
sum() | Trả về tổng số tất cả các phần tử trong set. |
Frozenset trong Python
Frozenset là một lớp mới, có đặc điểm của một set, nhưng phần tử của nó không thể thay đổi được sau khi gán. Để dễ hình dung thì tuple là list bất biến còn frozenset là set bất biến.
Các set có thể thay đổi được nhưng không thể băm (hash) được, do đó không thể sử dụng set để làm key cho dictionary. Nhưng frozenset có thể băm được nên có thể dùng như các key cho dictionary.
Frozenset có thể tạo bằng hàm frozenset(). Kiểu dữ liệu này hỗ trợ các phương thức như copy(), difference(), intersection(), isdisjoint(), issubset(), issuperset(), symmetric_difference() và union(). Vì không thể thay đổi nên phương thức add() hay remove() không sử dụng được trên frozenset.
7. Dictionary
Dictionary trong Python là một cấu trúc dữ liệu tương tự như một mảng kết hợp được tìm thấy ở các ngôn ngữ lập trình khác.Một mảng hay danh sách đánh chỉ mục các nhân tố theo vị trí. Nói cách khác, một dictionary chỉ mục theo keys. Chúng có thể ở dạng chuỗi.
Cách tạo dictionary trong Python
Trong Python, dictionary được định nghĩa trong dấu ngoặc nhọn {} với mỗi phần tử là một cặp theo dạng key:value. Key và value này có thể là bất kỳ kiểu dữ liệu nào. Bạn cũng có thể tạo dictionary bằng cách sử dụng hàm dict() được tích hợp sẵn.
Ví dụ:
dict1 = {} #dictionary rỗng #dict2 là dictionary với các khóa nguyên dict2 = {1: 'TipsMake.com',2: 'Công nghệ'} #Tạo dictionary với khóa hỗn hợp dict3 = {'tên': 'QTM', 1: [1, 3, 5]} #Tạo dictionary bằng dict() dict4 = dict({1:'apple', 2:'ball'}) #Tạo dictionary từ chuỗi với mỗi mục là một cặp dict5 = dict([(1,'QTM'), (2,'CN')])
Khi thực hiện kiểm tra kiểu dữ liệu của d ta được kết quả:
>>> type(dict2)
Trích xuất mảng
Phương thức sau mô tả việc trích xuất thông tin dictionary Python dưới dạng biểu mẫu theo mảng. Mảng kết quả có thể được lặp qua việc dùng cấu trúc Python bình thường. Tuy nhiên, nhớ mảng trả về có thể lớn, tùy thuộc vào kích thước của dictionary. Do đó, tốt hơn hết máy tính của bạn nên có nhiều dung lượng để xử lý mảng. ví dụ:
users = {'firstname': 'John', 'lastname': 'Smith', 'age': 27} print(users.keys()) # prints ['lastname', 'age', 'firstname']
Truy cập phần tử của dictionary
Các kiểu dữ liệu lưu trữ khác sử dụng index để truy cập vào các giá trị thì dictionary sử dụng các key. Key có thể được sử dụng trong cặp dấu ngoặc vuông hoặc sử dụng get().
Sử dụng khóa để trích xuất dữ liệu:
#khai báo và gán giá trị dict2 dict2 = {1: 'TipsMake.com','TipsMake': 'Công nghệ'} print(type(dict2)) #in kiểu dữ liệu của dict2 #trích xuất dữ liệu bằng khóa rồi in print("dict2[1] = ", dict2[1]) print("dict2[TipsMake] = ",dict2['TipsMake'])
Chạy đoạn code trên ta sẽ được kết quả:
dict2[1] = TipsMake dict2[TipsMake] = Công nghệ
Truy cập khóa - giá trị trong dictionary
Để truy cập các mục của một dictionary, hãy tham chiếu tới tên khóa (key) của nó. Key ở đây có thể được dùng bên trong các dấu ngoặc vuông. Ngoài ra, lập trình viên còn có một phương thức tên get() cũng giúp truy cập thành phần này từ một dictionary.
# Ví dụ lập trình Python minh họa cách truy cập một phần tử từ dictionary # Tạo một Dictionary Dict = {1: 'Geeks', 'name': 'For', 3: 'Geeks'} # Truy cập phần tử bằng key print("Accessing a element using key:") print(Dict['name']) # Truy cập phần tử bằng get() # Phương thức print("Accessing a element using get:") print(Dict.get(3))
Kết quả:
Truy cập một phần tử bằng key: For Truy cập một phần tử bằng get: Geeks
Thay đổi, thêm phần tử cho dictionary
Dictionary có thể thay đổi, nên có thể thêm phần tử mới hoặc thay đổi giá trị của các phần tử hiện có bằng cách sử dụng toán tử gán. Nếu key đã có, giá trị sẽ được cập nhật, nếu là một cặp key: value mới thì sẽ được thêm thành phần tử mới.
dict2 = {1: 'TipsMake.com','TipsMake': 'Công nghệ'} #cập nhật giá trị dict2['TipsMake'] = 'Quản trị mạng' #output: {1: 'TipsMake.com', 'TipsMake': 'Quản trị mạng'} print(dict2) #thêm phần tử mới dict2[2] = 'Python' #output: {1: 'TipsMake.com', 'TipsMake': 'Quản trị mạng', 2: 'Python'} print(dict2)
Xóa phần tử từ dictionary
Bạn có thể xóa phần tử cụ thể của dictionary bằng cách sử dụng pop(), nó sẽ phần tử có key đã cho và trả về giá trị của phần tử. popitem() có thể xóa và trả về một phần tử tùy ý dưới dạng (key, value). Tất cả các phần tử trong dictionary có thể bị xóa cùng lúc bằng cách dùng clear(). Ngoài ra, từ khóa del cũng có thể dùng để xóa một phần tử hoặc toàn bộ dictionary.
# tạo dictionary binh_phuong = {1:1, 2:4, 3:9, 4:16, 5:25} # xóa phần tử số 4 # Output: 16 print(binh_phuong.pop(4)) # Output: {1: 1, 2: 4, 3: 9, 5: 25} print(binh_phuong) # xóa phần tử cụ thể del binh_phuong[2] # output: {1: 1, 3: 9, 5: 25} print(binh_phuong) # xóa phần tử bất kỳ # Output: (5, 25) print(binh_phuong.popitem()) # Output: {1: 1, 3: 9} print(binh_phuong) # xóa tất cả phần tử binh_phuong.clear() # output: {} print(binh_phuong) # xóa dictionary binh_phuong del binh_phuong # tạo lỗi nếu bỏ # ở lệnh sau # print(squares)
Các phương thức và hàm cho dictionary
Đây là những phương thức thường dùng với dictionary:
Method | Mô tả |
---|---|
clear() | Xóa tất cả phần tử của dictionary. |
copy() | Trả về một bản sao shollow copy của dictionary. |
fromkeys(seq[,v]) | Trả về dictionary mới với key từ seq và value bằng v (default là None ). |
get(key[,d]) | Trả về giá trị của key, nếu key không tồn tại, trả về d. (default là None ). |
items() | Trả lại kiểu xem mới của các phần tử trong dictionary (key, value). |
keys() | Trả về kiểu xem mới của các key trong dictionary. |
pop(key[,d]) | Xóa phần tử bằng key và trả về giá trị hoặc d nếu key không tìm thấy. Nếu d không được cấp, key không tồn tại thì sẽ tạo lỗi KeyError . |
popitem() | Xóa và trả về phần tử bất kỳ ở dạng (key, value). Tạo lỗi KeyError nếu dictionary rỗng. |
setdefault(key,[,d]) | Nếy key tồn tại trả về value của nó, nếu không thêm key với value là d và trả về d (default là None ). |
update([other]) | Cập nhật dictionary với cặp key/value từ other, ghi đè lên các key đã có. |
values() | Trả về kiểu view mới của value trong dictionary. |
Các hàm tích hợp như all(), any(), len(), cmp(), sorted(),. thường được sử dụng với dictionary để thực hiện những nhiệm vụ khác nhau.
Dictionary comprehension trong Python
Dictionary comprehension là cách đơn giản, rút gọn để tạo dictionary mới từ một vòng lặp trong Python. Câu lệnh sẽ bao gồm một cặp biểu thức (key:value) cùng câu lệnh for, tất cả đặt trong dấu {}. Dưới đây là ví dụ tạo dictionary với mỗi pahàn tử là một cặp số và lập phương của nó.
lap_phuong = {x: x*x*x for x in range(6)} # Output: {0: 0, 1: 1, 2: 8, 3: 27, 4: 64, 5: 125} print(lap_phuong)
Chương trình trên tương đương với
lap_phuong = {} for x in range(6): lap_phuong[x] = x*x*x print(lap_phuong)
Bạn cũng có thể sử dụng lệnh if trong dictionary comprehension. Lệnh if có thể lọc những phần tử trong dictionary hiện có để tạo thành dictionary mới như ví dụ dưới đây:
lap_phuong_chan = {x: x*x*x for x in range (10) if x%2==0} # output: {0: 0, 2: 8, 4: 64, 6: 216, 8: 512} print(lap_phuong_chan)
Kiểm tra và lặp qua phần tử trong dictionary
Bạn chỉ có thể kiểm tra key của phần tử đã có trong dictionary hay chưa bằng cách dùng in, và không thể làm điều đó với value.
lap_phuong = {0: 0, 1: 1, 2: 8, 3: 27, 4: 64, 5: 125} #output: True print (2 in lap_phuong) #output: False print (9 in lap_phuong) #output: False print (5 not in lap_phuong)
Bạn có thể sử dụng vòng lặp for để lặp qua key của các phần tử trong dictionary.
lap_phuong = {0: 0, 1: 1, 2: 8, 3: 27, 4: 64, 5: 125} for i in lap_phuong print(lap_phuong[i])
Chạy code trên, các giá trị tương ứng với từng key sẽ được in ra màn hình theo thứ tự của key.
8. Chuyển đổi giữa các kiểu dữ liệu
Chúng ta có thể chuyển đổi giữa các kiểu dữ liệu khác nhau bằng cách sử dụng hàm chuyển đổi kiểu khác nhau như int() (kiểu số nguyên), float() số thập phân, str() chuỗi,.
Ví dụ:
>>> float(11) 11.0
Chuyển đổi từ kiểu float sang kiểu int sẽ bị giảm giá trị (làm cho nó gần với số không hơn).
Ví dụ:
int(18.6) 18
Chuyển đổi từ string sang hoặc ngược lại phải có các giá trị tương thích.
Bạn có thể thực hiện chuyển đổi chuỗi này sang chuỗi khác:
>>> set([2,4,6]) {2,4,6} >>> tuple({3,5,7}) (3,5,7) >>> list('TipsMake') ['q', 'u', 'a', 'n', 't', 'r', 'i', 'm', 'a', 'n', 'g']
Để chuyển đổi sang dictionary, mỗi phần tử phải là một cặp như ví dụ dưới đây:
>>> dict([[2,4],[1,3]]) {2: 4, 1: 3} >>> dict([(3,9),(4,16)]) {3: 9, 4: 16}
9. Bước đầu tiên hướng tới lập trình
Tất nhiên, chúng ta có thể sử dụng Python cho những tác vụ phức tạp hơn là thêm vài phần tử vào chuỗi. Ví dụ, có thể viết một chuỗi con của dãy Fibonacci (dãy vô hạn các số tự nhiên bắt đầu bằng hai phần tử 0 và 1 hoặc 1 và 1, các phần tử sau đó được thiết lập bằng cách cộng hai phần tử trước nó lại) như sau:
>>> # Dãy Fibonacci: . # tổng của hai phần tử tạo nên phần tử tiếp theo . a, b = 0, 1 >>> while b < 10: . print(b) . a, b = b, a+b . 1 1 2 3 5 8
Ví dụ này giới thiệu một số tính năng mới:
- Dòng đầu tiên chứa một phép gán kép: Biến a và b đồng thời nhận được giá trị 0 và 1. Dòng cuối cùng, nó được sử dụng lại, thể hiện rằng các biểu thức ở phía bên phải sẽ được tính (ở đây là cộng tổng a và b) trước khi bất kỳ hành động gán nào được diễn ra. Biểu thức bên phải được tính từ trái sang phải
- Vòng lặp while sẽ được thực thi nếu điều kiện (ở đây là b<10) vẫn đúng: Trong Python, cũng giống C, bất kỳ giá trị số nguyên khác 0 nào cũng đúng, 0 là sai. Điều kiện có thể là một chuỗi, danh sách, thậm chí một chuỗi tuần tự hay bất cứ thứ gì có độ dài khác 0 đều đúng, chuỗi rỗng sẽ sai. Phép kiểm tra trong ví dụ trên là một so sánh khá đơn giản. Các toán tử so sánh chuẩn được viết giống như C: < (nhỏ hơn), > (lớn hơn), == (bằng), <=, >= và != (không bằng/khác).
- Thân của vòng lặp được viết thụt vào trong: Thụt đầu dòng là cách mà Python nhóm các lệnh. Tại dấu nhắc lệnh, bạn có thể nhấn tab hoặc phím cách để thụt lề. Một trình soạn thảo code sẽ hỗ trợ tốt hơn cho việc nhập những đoạn code Python phức tạp, thông thường các trình soạn thảo này đề có thụt lề tự động. Khi nhập một khối lệnh bạn phải chèn thêm một dòng trống ở cuối cùng để kết thúc khối lệnh (vì trình phân tích cú pháp không thể phân tích khi nào bạn hoàn tất dòng lệnh cuối cùng trong khối). Lưu ý là mỗi dòng trong một khối lệnh cơ bản phải được thụt vào cùng một khoảng giống nhau.
- Hàm print() viết ra giá trị của các đối số mà nó được cung cấp: Nó khác với việc chỉ viết những biểu thức bạn muốn viết (như trong ví dụ dùng Python như một chiếc máy tính) theo cách xử lý nhiều đối số, số lượng dấu chấm động và chuỗi. Các chuỗi được in sẽ không có dấu ngoặc kép, một khoảng trắng được chèn vào giữa các mục, do đó, bạn có thể định dạng chúng theo ý thích, giống như thế này:
>>> i = 256*256 >>> print('The value of i is', i) The value of i is 65536
Có thể sử dụng thêm đối số end cho hàm print() để tránh thêm dòng mới trong kết quả đầu ra hoặc kết thúc kết quả với một chuỗi khác:
>>> a, b = 0, 1 >>> while b < 1000: . print(b, end=',') . a, b = b, a+b . 1,1,2,3,5,8,13,21,34,55,89,144,233,377,610,987,
Đến đây các bạn đã bắt đầu hình dung được phần nào về Python rồi đúng không? Hãy cùng chờ đón những bài học tiếp theo về các câu lệnh, cấu trúc dữ liệu trong Python nhé.
You should read it
- Python data type: string, number, list, tuple, set and dictionary
- For in Python loop
- Write a program to reverse a string in Python
- Ascii () function in Python
- Int () function in Python
- Array in Python
- String (String) in C #
- The slice () function in Python
- The chr () function in Python
- String (String) in PHP
- The input () function in Python
- String (String) in C / C ++