Kỹ thuật lập trình C - Chương 03: Tổ chức dữ liệu trong chương trình

Tài liệu nghiên cứu Ch03 to chuc du lieu, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên sâu về ., phục vụ nghiên cứu và ứng dụng thực tiễn

Người đăng

Ẩn danh

Phí lưu trữ

30 Point

Tóm tắt

I. Hướng dẫn tổ chức dữ liệu Nền tảng cốt lõi trong lập trình

Tổ chức dữ liệu là một khái niệm nền tảng trong khoa học máy tính và kỹ thuật lập trình. Nó đề cập đến phương pháp sắp xếp và lưu trữ dữ liệu trong bộ nhớ máy tính để có thể truy cập và sử dụng một cách hiệu quả. Một chương trình không chỉ bao gồm các câu lệnh, mà còn phải quản lý dữ liệu mà nó xử lý. Theo tài liệu 'Kỹ thuật lập trình' của Trần Quang, dữ liệu trong chương trình C thường xuất hiện dưới ba hình thức chính: giá trị cố định (Literals), hằng số (Constants), và biến (Variables). Việc hiểu rõ cách tổ chức dữ liệu từ các thành phần cơ bản này là bước đầu tiên để xây dựng các ứng dụng mạnh mẽ và tối ưu. Lựa chọn đúng cách để biểu diễn thông tin, dù là một con số, một chuỗi ký tự hay một tập hợp dữ liệu phức tạp, sẽ ảnh hưởng trực tiếp đến hiệu suất và khả năng bảo trì của phần mềm. Ví dụ, một biến được định nghĩa không chỉ bằng tên gọi, mà còn bởi kiểu dữ liệu và giá trị nó chứa. Kiểu dữ liệu quy định phạm vi giá trị và các phép toán có thể thực hiện, ảnh hưởng đến việc cấp phát bộ nhớ động và hiệu quả tính toán. Do đó, việc nắm vững các nguyên tắc cơ bản về tổ chức dữ liệu là yêu cầu bắt buộc đối với mọi lập trình viên, tạo tiền đề để tiếp cận các cấu trúc dữ liệu và giải thuật phức tạp hơn.

1.1. Các khái niệm cơ bản Biến Hằng và Kiểu dữ liệu

Để bắt đầu, cần phân biệt rõ ba khái niệm cốt lõi. Biến (Variable) là một vùng trong bộ nhớ được đặt tên, dùng để lưu trữ dữ liệu có thể thay đổi trong quá trình thực thi chương trình. Tài liệu gốc nhấn mạnh, một biến có ba đặc điểm: tên, kiểu và giá trị. Hằng (Constant) cũng là một giá trị được đặt tên, nhưng giá trị của nó không thể thay đổi sau khi đã được định nghĩa. Việc sử dụng hằng số giúp mã nguồn dễ đọc và dễ bảo trì hơn. Cuối cùng, Kiểu dữ liệu (Data Type) xác định loại dữ liệu mà một biến có thể lưu trữ, ví dụ như số nguyên (int), số thực (float), hay ký tự (char). Mỗi kiểu dữ liệu có một cách tổ chức lưu trữ và các phép toán đi kèm khác nhau, quyết định đến không gian bộ nhớ cần thiết và hiệu quả xử lý. Việc khai báo đúng kiểu dữ liệu là bước đầu tiên trong việc tổ chức dữ liệu hiệu quả, tránh lãng phí tài nguyên và các lỗi không mong muốn.

1.2. Kiểu dữ liệu do người dùng định nghĩa Enum và Struct

Ngoài các kiểu dữ liệu cơ bản, ngôn ngữ lập trình như C/C++ cho phép người dùng tự định nghĩa các kiểu dữ liệu phức tạp hơn. Struct (cấu trúc) cho phép kết hợp nhiều thành phần dữ liệu có kiểu khác nhau thành một thực thể duy nhất. Đây là nền tảng để tạo ra các kiểu dữ liệu trừu tượng (ADT), mô hình hóa các đối tượng trong thế giới thực một cách hiệu quả. Ví dụ, một struct SinhVien có thể chứa các trường như hoTen (chuỗi), maSo (số nguyên) và diemTrungBinh (số thực). Một kiểu khác là Enum (kiểu liệt kê), dùng để định nghĩa một tập hợp các hằng số nguyên có tên gợi nhớ. Thay vì sử dụng các con số tùy ý, lập trình viên có thể dùng các tên có ý nghĩa như RED, GREEN, BLUE, giúp mã nguồn trở nên rõ ràng và giảm thiểu lỗi logic. Cả hai đều là công cụ mạnh mẽ để tổ chức dữ liệu một cách tường minh và có cấu trúc.

II. Thách thức khi chọn cấu trúc dữ liệu không phù hợp cho bài toán

Việc lựa chọn sai cấu trúc dữ liệu là một trong những nguyên nhân hàng đầu dẫn đến các vấn đề nghiêm trọng về hiệu suất và khả năng mở rộng của phần mềm. Mỗi cấu trúc dữ liệu được thiết kế để tối ưu cho các loại thao tác nhất định. Nếu sử dụng một cấu trúc không phù hợp, chương trình có thể chạy chậm một cách đáng kể, tiêu tốn tài nguyên bộ nhớ không cần thiết, và trở nên cực kỳ khó bảo trì. Ví dụ, sử dụng một danh sách liên kết (linked list) để thực hiện các thao tác truy cập ngẫu nhiên thường xuyên sẽ rất chậm, vì nó đòi hỏi phải duyệt qua các phần tử từ đầu. Trong trường hợp này, một mảng (array) sẽ là lựa chọn tốt hơn nhiều. Ngược lại, việc chèn và xóa phần tử ở giữa một mảng lớn lại tốn kém chi phí, trong khi danh sách liên kết thực hiện thao tác này rất hiệu quả. Thách thức không chỉ nằm ở việc hiểu đặc điểm của từng cấu trúc, mà còn ở khả năng phân tích yêu cầu bài toán để đưa ra quyết định tối ưu. Một quyết định sai lầm ở giai đoạn đầu có thể dẫn đến việc phải thiết kế lại toàn bộ hệ thống sau này, gây tốn kém thời gian và công sức.

2.1. Hiệu suất kém và độ phức tạp thuật toán không cần thiết

Một trong những hậu quả rõ ràng nhất của việc chọn sai cấu trúc là sự gia tăng về độ phức tạp thuật toán. Mỗi thao tác trên một cấu trúc dữ liệu (như thêm, xóa, tìm kiếm) đều có một chi phí tính toán nhất định, thường được biểu diễn bằng ký hiệu Big O. Ví dụ, việc tìm kiếm một phần tử trong một mảng không được sắp xếp có độ phức tạp là O(n), nghĩa là thời gian tìm kiếm tăng tuyến tính với số lượng phần tử. Tuy nhiên, nếu dữ liệu được tổ chức trong một cây nhị phân tìm kiếm (binary search tree) cân bằng, thao tác tương tự chỉ mất O(log n). Sự khác biệt này trở nên cực kỳ lớn khi xử lý hàng triệu bản ghi. Việc lựa chọn không chính xác có thể biến một giải thuật hiệu quả thành một nút thắt cổ chai, làm giảm trải nghiệm người dùng và giới hạn khả năng xử lý của ứng dụng.

2.2. Quản lý bộ nhớ Vấn đề cấp phát bộ nhớ động và con trỏ

Quản lý bộ nhớ là một thách thức lớn khác. Các cấu trúc như mảng thường yêu cầu cấp phát bộ nhớ tĩnh hoặc một khối bộ nhớ liền kề, gây khó khăn khi kích thước dữ liệu không xác định trước. Ngược lại, các cấu trúc như danh sách liên kết (linked list) hay cây nhị phân (binary tree) sử dụng cấp phát bộ nhớ động và con trỏ (pointer) để liên kết các nút. Mặc dù linh hoạt, cách tiếp cận này tiềm ẩn nguy cơ rò rỉ bộ nhớ (memory leak) nếu lập trình viên quên giải phóng bộ nhớ đã cấp phát. Việc sử dụng con trỏ không đúng cách cũng có thể dẫn đến các lỗi nghiêm trọng như truy cập vùng nhớ không hợp lệ. Do đó, việc lựa chọn cấu trúc dữ liệu cũng đồng nghĩa với việc lựa chọn một cơ chế quản lý bộ nhớ phù hợp, đòi hỏi sự cẩn trọng và hiểu biết sâu sắc về cách chương trình tương tác với tài nguyên hệ thống.

III. Cách tổ chức dữ liệu tuyến tính Mảng Stack và Queue hiệu quả

Các cấu trúc dữ liệu tuyến tính là nhóm cấu trúc mà các phần tử được sắp xếp theo một trình tự tuần tự. Đây là những cấu trúc cơ bản và phổ biến nhất trong lập trình, đóng vai trò nền tảng cho nhiều giải thuật phức tạp. Ba đại diện tiêu biểu nhất của nhóm này là mảng (array), ngăn xếp (stack), và hàng đợi (queue). Mặc dù đều tổ chức dữ liệu theo một đường thẳng, mỗi cấu trúc lại có những đặc điểm và quy tắc truy cập riêng biệt, phù hợp với các loại bài toán khác nhau. Mảng nổi bật với khả năng truy cập phần tử ngẫu nhiên cực nhanh thông qua chỉ số. Ngăn xếp hoạt động theo nguyên tắc LIFO (Last-In, First-Out), rất hữu ích trong việc quản lý lời gọi hàm hoặc các tác vụ cần hoàn tác. Hàng đợi lại tuân theo nguyên tắc FIFO (First-In, First-Out), mô phỏng hoàn hảo các hệ thống xếp hàng trong thực tế. Việc hiểu rõ sự khác biệt và lựa chọn đúng cấu trúc tuyến tính là kỹ năng thiết yếu để tối ưu hóa việc tổ chức dữ liệu trong các ứng dụng thông thường.

3.1. Mảng array và Danh sách liên kết linked list So sánh

Mảng (array) là một tập hợp các phần tử cùng kiểu, được lưu trữ tại các vị trí bộ nhớ liền kề nhau. Ưu điểm lớn nhất của nó là khả năng truy cập tức thời vào bất kỳ phần tử nào thông qua chỉ số (độ phức tạp O(1)). Tuy nhiên, kích thước của mảng thường là cố định, việc thay đổi kích thước hoặc chèn/xóa phần tử ở giữa rất tốn kém. Ngược lại, danh sách liên kết (linked list) bao gồm các nút (node) được kết nối với nhau bằng con trỏ (pointer). Cấu trúc này rất linh hoạt, cho phép thêm bớt phần tử dễ dàng với chi phí O(1) nếu đã có con trỏ trỏ đến vị trí cần thao tác. Nhược điểm của nó là không hỗ trợ truy cập ngẫu nhiên; để đến được phần tử thứ n, cần phải duyệt qua n-1 phần tử đầu tiên (độ phức tạp O(n)). Lựa chọn giữa mảng và danh sách liên kết phụ thuộc vào tần suất của các thao tác truy cập so với thao tác chỉnh sửa.

3.2. Ngăn xếp stack và Hàng đợi queue làm kiểu dữ liệu trừu tượng

Ngăn xếp (stack) và Hàng đợi (queue) là hai kiểu dữ liệu trừu tượng (ADT) quan trọng. Một ADT định nghĩa một tập hợp các thao tác mà không chỉ định cách chúng được thực hiện. Ngăn xếp chỉ cho phép hai thao tác chính: push (thêm một phần tử vào đỉnh) và pop (lấy một phần tử ra khỏi đỉnh). Nguyên tắc LIFO của nó rất hữu ích cho các thuật toán đệ quy, phân tích cú pháp biểu thức, hay chức năng undo/redo. Hàng đợi cũng có hai thao tác chính: enqueue (thêm một phần tử vào cuối) và dequeue (lấy một phần tử ra khỏi đầu). Nguyên tắc FIFO của nó được ứng dụng rộng rãi trong lập lịch CPU, quản lý yêu cầu trong hệ thống mạng, hay các thuật toán tìm kiếm theo chiều rộng (BFS) trên đồ thị (graph). Cả hai đều có thể được triển khai bằng mảng hoặc danh sách liên kết.

IV. Phương pháp cấu trúc dữ liệu phi tuyến Cây và Đồ thị tối ưu

Khi dữ liệu có mối quan hệ phân cấp hoặc mạng lưới phức tạp, các cấu trúc tuyến tính không còn đủ khả năng biểu diễn hiệu quả. Đây là lúc các cấu trúc dữ liệu phi tuyến như cây nhị phân (binary tree) và đồ thị (graph) phát huy vai trò của mình. Không giống như cấu trúc tuyến tính, các phần tử trong cấu trúc phi tuyến có thể được kết nối với nhiều phần tử khác. Cây là một cấu trúc phân cấp, lý tưởng để biểu diễn các mối quan hệ cha-con, chẳng hạn như hệ thống file trên máy tính, cây gia phả, hoặc cấu trúc của một tài liệu XML. Đồ thị, mặt khác, là một cấu trúc tổng quát hơn, cho phép mô hình hóa các mối quan hệ nhiều-nhiều phức tạp, ví dụ như mạng xã hội, bản đồ đường đi, hay mạng lưới máy tính. Việc nắm vững cách tổ chức dữ liệu bằng cây và đồ thị mở ra khả năng giải quyết một lớp bài toán rộng lớn và phức tạp hơn, từ sắp xếp và tìm kiếm hiệu quả đến việc tìm đường đi ngắn nhất.

4.1. Cây nhị phân binary tree Tổ chức dữ liệu phân cấp

Cây nhị phân (binary tree) là một cấu trúc dữ liệu trong đó mỗi nút có tối đa hai nút con, thường được gọi là con trái và con phải. Một biến thể đặc biệt quan trọng là cây nhị phân tìm kiếm (Binary Search Tree - BST), nơi giá trị của mọi nút trong cây con trái nhỏ hơn giá trị của nút cha, và giá trị của mọi nút trong cây con phải lớn hơn. Đặc tính này cho phép các thao tác tìm kiếm, chèn, và xóa phần tử có độ phức tạp thuật toán trung bình là O(log n), nhanh hơn đáng kể so với O(n) của danh sách liên kết. Các thao tác duyệt cây thường được thực hiện bằng thuật toán đệ quy, một kỹ thuật lập trình mạnh mẽ. Cây nhị phân là nền tảng cho nhiều cấu trúc dữ liệu nâng cao khác như cây AVL, cây Đỏ-Đen, giúp đảm bảo hiệu suất ngay cả trong trường hợp xấu nhất.

4.2. Đồ thị graph Mô hình hóa các mối quan hệ phức tạp

Một đồ thị (graph) bao gồm một tập hợp các đỉnh (vertices) và một tập hợp các cạnh (edges) nối các cặp đỉnh. Đồ thị là công cụ tối ưu để mô hình hóa các mạng lưới, nơi các thực thể có mối liên kết với nhau. Ví dụ, trong một mạng xã hội, mỗi người dùng là một đỉnh và mối quan hệ bạn bè là một cạnh. Các giải thuật trên đồ thị như Tìm kiếm theo chiều sâu (DFS) và Tìm kiếm theo chiều rộng (BFS) là nền tảng để giải quyết nhiều bài toán, bao gồm kiểm tra tính liên thông, tìm chu trình, hay tìm đường đi giữa hai đỉnh. Các thuật toán phức tạp hơn như Dijkstra hay A* được sử dụng để tìm đường đi ngắn nhất, có ứng dụng trực tiếp trong các hệ thống định vị GPS và logistics. Việc biểu diễn và tổ chức dữ liệu bằng đồ thị là chìa khóa để giải quyết các bài toán tối ưu hóa và phân tích mạng lưới.

V. Tối ưu tổ chức dữ liệu Bảng băm và giải thuật tìm kiếm nhanh

Trong nhiều ứng dụng thực tế, tốc độ truy xuất dữ liệu là yếu tố quyết định. Mặc dù cây nhị phân tìm kiếm cung cấp hiệu suất O(log n), vẫn có những trường hợp đòi hỏi thời gian truy cập gần như tức thời. Đây là lúc bảng băm (hash table) thể hiện sức mạnh vượt trội của mình. Bằng cách sử dụng một hàm băm để ánh xạ khóa (key) thành một chỉ số trong mảng, bảng băm cho phép thực hiện các thao tác thêm, xóa, và tìm kiếm với độ phức tạp thuật toán trung bình là O(1). Bên cạnh việc lựa chọn cấu trúc, việc áp dụng các giải thuật hiệu quả cũng là một phần không thể thiếu của việc tổ chức dữ liệu. Các thuật toán sắp xếp và tìm kiếm là hai trong số những công cụ cơ bản và mạnh mẽ nhất. Một tập dữ liệu được sắp xếp tốt cho phép áp dụng các thuật toán tìm kiếm hiệu quả như tìm kiếm nhị phân. Việc kết hợp một cấu trúc dữ liệu phù hợp với một giải thuật tối ưu là bí quyết để xây dựng các hệ thống có hiệu năng cao và khả năng đáp ứng nhanh chóng.

5.1. Bảng băm hash table Bí quyết truy xuất dữ liệu tức thì

Bảng băm (hash table) là một cấu trúc dữ liệu ánh xạ các khóa tới các giá trị. Hoạt động cốt lõi của nó dựa trên một hàm băm (hash function), có nhiệm vụ chuyển đổi một khóa có kiểu dữ liệu bất kỳ thành một chỉ số (index) của một mảng (array). Giá trị tương ứng với khóa sẽ được lưu tại chỉ số đó. Khi cần tìm kiếm, hàm băm sẽ tính toán lại chỉ số và truy cập trực tiếp vào phần tử trong mảng, mang lại tốc độ O(1). Thách thức chính của bảng băm là xử lý xung đột (collision), xảy ra khi hai khóa khác nhau được băm ra cùng một chỉ số. Các kỹ thuật giải quyết xung đột phổ biến bao gồm tạo danh sách liên kết tại mỗi chỉ số (chaining) hoặc tìm một ô trống kế tiếp (open addressing). Bảng băm được ứng dụng rộng rãi trong việc triển khai từ điển, bộ nhớ đệm (cache), và tra cứu cơ sở dữ liệu.

5.2. Tầm quan trọng của sắp xếp và tìm kiếm trong xử lý dữ liệu

Sắp xếp và tìm kiếm là hai nhóm giải thuật nền tảng trong khoa học máy tính. Thuật toán sắp xếp (ví dụ: Quick Sort, Merge Sort, Heap Sort) có nhiệm vụ sắp đặt các phần tử trong một tập hợp theo một thứ tự nhất định. Một khi dữ liệu đã được sắp xếp, các thuật toán tìm kiếm sẽ trở nên hiệu quả hơn rất nhiều. Tìm kiếm nhị phân (Binary Search) là một ví dụ điển hình, có thể tìm thấy một phần tử trong một mảng đã sắp xếp với độ phức tạp thuật toán O(log n), nhanh hơn rất nhiều so với tìm kiếm tuyến tính O(n). Việc lựa chọn thuật toán sắp xếp phù hợp phụ thuộc vào các yếu tố như kích thước dữ liệu, trạng thái sắp xếp ban đầu, và yêu cầu về bộ nhớ. Nắm vững các kỹ thuật này là điều kiện tiên quyết để xử lý và khai thác thông tin từ các tập dữ liệu lớn một cách hiệu quả.

VI. Kết luận Tương lai của tổ chức dữ liệu và các xu hướng mới

Qua các phân tích trên, có thể thấy rằng tổ chức dữ liệu không chỉ là việc lưu trữ thông tin, mà là một nghệ thuật và khoa học về việc cấu trúc thông tin để tối ưu hóa hiệu suất và hiệu quả. Từ những khái niệm cơ bản như biến, hằng, đến các cấu trúc dữ liệu phức tạp như cây nhị phân (binary tree), đồ thị (graph), và bảng băm (hash table), mỗi lựa chọn đều có tác động sâu sắc đến chương trình. Một lập trình viên giỏi không chỉ viết được mã chạy đúng, mà còn phải viết được mã chạy nhanh và sử dụng tài nguyên một cách thông minh. Điều này đòi hỏi một sự hiểu biết sâu sắc về các cấu trúc dữ liệu và giải thuật, cũng như khả năng phân tích để áp dụng chúng vào đúng bài toán. Trong bối cảnh công nghệ không ngừng phát triển, lĩnh vực tổ chức dữ liệu cũng đang đối mặt với những thách thức và cơ hội mới, đòi hỏi sự học hỏi và thích ứng liên tục từ cộng đồng lập trình viên.

6.1. Tóm tắt vai trò của các cấu trúc dữ liệu và giải thuật

Tóm lại, cấu trúc dữ liệu cung cấp một phương tiện để lưu trữ và tổ chức dữ liệu, trong khi giải thuật cung cấp các phương pháp để thao tác trên dữ liệu đó. Mảng (array) và danh sách liên kết (linked list) giải quyết các bài toán lưu trữ tuần tự. Ngăn xếp (stack) và hàng đợi (queue) quản lý dữ liệu dựa trên các quy tắc truy cập cụ thể. Cây nhị phân (binary tree) và đồ thị (graph) mô hình hóa các mối quan hệ phân cấp và mạng lưới. Bảng băm (hash table) cung cấp khả năng truy xuất siêu tốc. Việc lựa chọn và kết hợp chúng một cách khéo léo, dựa trên phân tích về độ phức tạp thuật toán và yêu cầu bộ nhớ, là chìa khóa để xây dựng các phần mềm hiệu quả, mạnh mẽ và có khả năng mở rộng.

6.2. Xu hướng mới và tác động trong thời đại Dữ liệu lớn

Trong thời đại Dữ liệu lớn (Big Data) và Trí tuệ nhân tạo (AI), nhu cầu về tổ chức dữ liệu hiệu quả càng trở nên cấp thiết. Các cấu trúc dữ liệu truyền thống đang được cải tiến và phát triển để xử lý các tập dữ liệu khổng lồ, phân tán trên nhiều máy chủ. Các cấu trúc mới như cây B+ (B+ Tree) được sử dụng rộng rãi trong hệ quản trị cơ sở dữ liệu, hay các cấu trúc xác suất như Bloom Filter giúp kiểm tra sự tồn tại của phần tử một cách nhanh chóng và tiết kiệm bộ nhớ. Hơn nữa, sự phát triển của điện toán song song và phân tán đòi hỏi các cấu trúc dữ liệu và giải thuật có khả năng hoạt động đồng thời (concurrent data structures), đảm bảo tính toàn vẹn dữ liệu trong môi trường đa luồng. Tương lai của lĩnh vực này sẽ tiếp tục gắn liền với việc giải quyết các thách thức về quy mô, tốc độ và độ phức tạp của dữ liệu.

15/07/2025

Bạn đang xem trước tài liệu:

Ch03 to chuc du lieu

Tải đầy đủ

Trích đoạn nội dung tài liệu

Chương 03 Tổ chức dữ liệu trong chương trình Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 1 Nội dung  Dữ liệu cố định  Hằng  Biến  Kiểu dữ liệu  Từ khoá  Tầm vực biến  Phép toán và biểu thức  Kiểu enum, struct  Chuyển đổi kiểu dữ liệu Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 2 Dữ liệu  Dữ liệu được lưu trữ trong RAM của máy tính trong quá trình chương trình thực thi  Dữ liệu trong các chương trình C thường xuất hiện dưới 3 hình thức:  Literals hay Fixed Value: giá trị cố định  Constant: hằng  có tên (name) và giá trị thay thế (value)  Variable: biến  có tên (name), kiểu (type) và nội dung chứa bên trong (value) Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 3 Giá trị cố định  Giá trị số:  Số nguyên hệ bát phân (octal): bắt đầu bằng số 0  Ví dụ: 0165 -0203  Số nguyên hệ thập lục (hexadecimal): bắt đầu bằng 0x  Ví dụ: 0x3D -0x3AF8  Số nguyên hệ thập phân (decimal): như bình thường  Ví dụ: 169 -2053  Số thực dấu chấm động: (floating point)  Ví dụ: 3.1E-9 Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 4 Giá trị cố định  Giá trị cố định kiểu số nguyên có thể có phần hậu tố (suffix) là sự kết hợp của U và L, cho kiểu Unsigned và kiểu Long. Có thể là chữ hoa hoặc chữ thường theo bất cứ thứ tự nào.  Ví dụ: 078 /* Không hợp lệ: 8 không có trong hệ bát phân*/ 032UU /* Khong hop le: không thể lặp lại hậu tố */ 30 /* int */ 30u /* unsigned int */ 30l /* long */ 30ul /* unsigned long */ Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 5 Giá trị cố định  Giá trị kiểu ký tự - chuỗi  Ký tự: đặt trong 2 dấu nháy đơn ('). Có thể ký tự bình thường (plain character) hay escape sequence ('\n', '\t', …)  Ví dụ: 'A' '7' '\101' '\t'  Chuỗi: đặt trong 2 dấu nháy kép (“)  Ví dụ: "Dai Hoc Bach Khoa" Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 6 Escape sequence Escape Escape sequenc Meaning Meaning sequence e \\ \ character \n Newline \' ' character \r Carriage return \" " character \t Horizontal tab \? ? character \v Vertical tab \a Alert or bell \ooo Octal number of one to three digits \b Backspace Hexadecimal number of one or \xhh.

\f Form feed more digits Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 7 Hằng  Hằng là một giá trị được đặt tên (thường dùng chữ in hoa)  Cú pháp định nghĩa hằng: const <type> <name> = <value> ; hay #define <ConstName> <value>  Ví dụ:  const int MAX = 15;  #define MAX 15 Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 8 Ví dụ  Kiểu ký tự const char c = ‘a’; const char c = ‘A’;  Kiểu chuỗi const char c[] = “LAP TRINH C/C++”; const char c[] = “SAI GON”;  Kiểu số const int a = 100; const float f = 10.5; Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 9 Biến  Biến là một vùng trong bộ nhớ của máy tính và có các đặc điểm sau:  Có tên (name): do người dùng tự đặt ra để dùng thay cho địa chỉ trong bộ nhớ  Có kiểu (type): liên quan đến loại và độ lớn của giá trị mà biến có thể chứa.  Có dữ liệu: là giá trị chứa trong biến. Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 10 Biến  Là nơi lưu trữ dữ liệu của chương trình, nói khác nó là 1 vùng nhớ được đặt tên  Do có tên, nên khi cần đọc/ghi với vùng nhớ này, người lập trình chỉ cần dùng tên thay cho một địa chỉ của nó.  Biến cần được khai báo trước khi dùng (đọc/ghi)  Chương trình tự động cấp phát vùng nhờ khi gặp một khai báo biến Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 11 Khai báo biến  Cú pháp: <type> <VariableName> [=<ConstExpr>]; trong đó:  <type> : kiểu có sẵn hay người dùng tự định nghĩa  <VariableName> : tên biến do người dùng tự đặt  <ConstExpr> : giá trị ban đầu, có thể có hoặc không Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 12 Khai báo biến Ví dụ:  Tạo một biến int a; char c;  Tạo nhiều biến cùng kiểu int a, b; char c1, c2;  Tạo biến và khởi động giá trị int a=10, b; char c1=‘A’, c2=‘a’; Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 13 Khai báo biến  Khai báo biến đã được định nghĩa trong module khác: extern <type> <variable> ;  Ví dụ: extern int so;  Khai báo biến tĩnh: static <type> <variable> [=<ConstExpr>];  Ví dụ: static long dem; Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 14 Quy tắc đặt tên biến  Quy tắc đặt tên biến theo quy tắc đặt tên danh hiệu (tên hằng, tên biến, …)  Quy tắc đặt tên danh hiệu:  Ký tự đầu là một chữ cái hay dấu gạch dưới (_)  Các ký tự tiếp theo là chữ cái, số, dấu gạch dưới  Không được là ký hiệu nào khác: ! @ # $ % ^ & * …  Không được trùng với từ khoá Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 15 Từ khoá  Là từ có ý nghĩa đặc biệt đã được quy định trước bởi ngôn ngữ lập trình.

 Người lập trình không được dùng từ khoá để đặt tên cho các tên mình tạo ra như tên biến, tên kiểu, tên hàm, tên hằng, v. Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 16 Từ khoá Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 17 Kiểu dữ liệu Dữ liệu mà chương trình lưu trữ có thể thuộc nhiều dạng khác nhau, gọi là kiểu dữ liệu (data type)  Ký tự (character)  Kiểu số  Số nguyên (integer)  Số thực (float)  Kiểu chuỗi  Kiểu mảng (array)  Kiểu cấu trúc (struct)  Kiểu kiệt kê (enum)  … Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 18 Kiểu dữ liệu  Mỗi kiểu dữ liệu có cách tổ chức lưu trữ, cũng như các phép toán đi kèm khác nhau  Cách tổ chức lưu trữ  Ví dụ: với số nguyên, ý nghĩa bit có trọng số lớn nhất (MSB) phụ thuộc vào nó là số có dấu hay không dấu  Số không dấu: bit này tham gia vào tính độ lớn giá trị  Số có dấu: bit này chỉ ra là số dương hay âm  Các phép toán  Ví dụ: có thể thực hiện các phép toán nhân hay chia với kiểu số, nhưng không thể thực hiện nhân với kiểu chuỗi ký tự Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 19 Các loại kiểu dữ liệu  Kiểu dữ liệu cơ bản (fundamental data type)  Ngôn ngữ C/C++ cung cấp sẵn một số các tên kiểu  Tên các kiểu này cũng là từ khoá  Kiểu dữ liệu do người lập trình định nghĩa (user- defined data type)  Tên kiểu do người lập trình tự đặt ra  Một số kiểu như: struct, enum  Kiểu dữ liệu dẫn xuất (derived data type)  Mảng (array)  Con trỏ (pointer) Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 20 Kiểu số nguyên Type Storage size Value range char 1 byte -128 to 127 or 0 to 255 unsigned char 1 byte 0 to 255 signed char 1 byte -128 to 127 -32,768 to 32,767 or int 2 or 4 bytes -2,147,483,648 to 2,147,483,647 0 to 65,535 unsigned int 2 or 4 bytes or 0 to 4,294,967,295 short 2 bytes -32,768 to 32,767 unsigned short 2 bytes 0 to 65,535 long 4 bytes -2,147,483,648 to 2,147,483,647 unsigned long 4 bytes 0 to 4,294,967,295 Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 21 Hàm sizeof()  Hàm sizeof() trả về số byte của kiểu dữ liệu  Ví dụ: printf("%d", sizeof(int));  Số bytes của kiểu dữ liệu tuỳ thuộc vào phiên bản, tuy nhiên sẽ thoả mãn: 1 == sizeof(char) <= sizeof(short) <= sizeof(int) <= sizeof(long) <= sizeof(long long) Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 22 Kiểu số thực Storage Type Value range Precision size float 4 byte 1.4E+38 6 decimal places double 8 byte 2.7E+308 15 decimal places long 3.4E-4932 to 10 byte 19 decimal places double 1.1E+4932  Thêm #include <float.h> vào đầu chương trình để sử dụng các chi tiết đã cài đặt sẵn của kiểu số thực Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 23 Kiểu enum  enum dùng để định nghĩa các giá trị thuộc kiểu số nguyên nhưng được gán cho tên gợi nhớ  Cú pháp: enum enumName { enumeration list }  ví dụ: enum colors {RED, GREEN, BLUE}; enum months {JAN, FEB, MAR, APR, MAY, JUN, JUL, AUG, SEP, OCT, NOV, DEC}; Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 24 Kiểu enum  enum có thể được xem như một kiểu dữ liệu.  Ở các ví dụ trên ta có các kiểu là: colors, months  Một biến kiểu colors chỉ có thể RED, GREEN, BLUE như đã khai báo  Một biến kiểu months ở trên chỉ có thể có các giá trị JAN, FEB, MAR, v.  Nghĩa là người dùng có thể tạo ra kiểu mới Trần Quang Kỹ thuật lập trình Chương 03: Tổ chức dữ liệu trong chương trình © 2016 25 Kiểu enum  enum có thể xem như một tập hợp các hằng số.

 Ở các ví dụ trên ta có các tập hợp: colors, months  Với tập colors có các hằng: RED, GREEN, BLUE như đã khai báo  Với tập months có các hằng: JAN, FEB, MAR, v.v…  Về bản chất, các giá trị trong tập hợp (enum) được TỰ ĐỘNG gán một con số nguyên. Mặc định hằng đầu tiên là 0, kế tiếp là 1, v.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Lập trình C cho người mới bắt đầu

kiến thức cơ bản về lập trình C

tổ chức và quản lý dữ liệu trong C

biến và các kiểu dữ liệu trong C

Kỹ thuật lập trình C - Chương 03: Tổ chức dữ liệu trong chương trình

I. Hướng dẫn tổ chức dữ liệu Nền tảng cốt lõi trong lập trình

1.1. Các khái niệm cơ bản Biến Hằng và Kiểu dữ liệu

1.2. Kiểu dữ liệu do người dùng định nghĩa Enum và Struct

II. Thách thức khi chọn cấu trúc dữ liệu không phù hợp cho bài toán

2.1. Hiệu suất kém và độ phức tạp thuật toán không cần thiết

2.2. Quản lý bộ nhớ Vấn đề cấp phát bộ nhớ động và con trỏ

III. Cách tổ chức dữ liệu tuyến tính Mảng Stack và Queue hiệu quả

3.1. Mảng array và Danh sách liên kết linked list So sánh

3.2. Ngăn xếp stack và Hàng đợi queue làm kiểu dữ liệu trừu tượng

IV. Phương pháp cấu trúc dữ liệu phi tuyến Cây và Đồ thị tối ưu

4.1. Cây nhị phân binary tree Tổ chức dữ liệu phân cấp

4.2. Đồ thị graph Mô hình hóa các mối quan hệ phức tạp

V. Tối ưu tổ chức dữ liệu Bảng băm và giải thuật tìm kiếm nhanh

5.1. Bảng băm hash table Bí quyết truy xuất dữ liệu tức thì

5.2. Tầm quan trọng của sắp xếp và tìm kiếm trong xử lý dữ liệu

VI. Kết luận Tương lai của tổ chức dữ liệu và các xu hướng mới

6.1. Tóm tắt vai trò của các cấu trúc dữ liệu và giải thuật

6.2. Xu hướng mới và tác động trong thời đại Dữ liệu lớn

THÔNG TIN CHI TIẾT

Đề tài: Ch03 To Chuc Du Lieu

Kỹ thuật lập trình C - Chương 03: Tổ chức dữ liệu trong chương trình

I. Hướng dẫn tổ chức dữ liệu Nền tảng cốt lõi trong lập trình

1.1. Các khái niệm cơ bản Biến Hằng và Kiểu dữ liệu

1.2. Kiểu dữ liệu do người dùng định nghĩa Enum và Struct

II. Thách thức khi chọn cấu trúc dữ liệu không phù hợp cho bài toán

2.1. Hiệu suất kém và độ phức tạp thuật toán không cần thiết

2.2. Quản lý bộ nhớ Vấn đề cấp phát bộ nhớ động và con trỏ

III. Cách tổ chức dữ liệu tuyến tính Mảng Stack và Queue hiệu quả

3.1. Mảng array và Danh sách liên kết linked list So sánh

3.2. Ngăn xếp stack và Hàng đợi queue làm kiểu dữ liệu trừu tượng

IV. Phương pháp cấu trúc dữ liệu phi tuyến Cây và Đồ thị tối ưu

4.1. Cây nhị phân binary tree Tổ chức dữ liệu phân cấp

4.2. Đồ thị graph Mô hình hóa các mối quan hệ phức tạp

V. Tối ưu tổ chức dữ liệu Bảng băm và giải thuật tìm kiếm nhanh

5.1. Bảng băm hash table Bí quyết truy xuất dữ liệu tức thì

5.2. Tầm quan trọng của sắp xếp và tìm kiếm trong xử lý dữ liệu

VI. Kết luận Tương lai của tổ chức dữ liệu và các xu hướng mới

6.1. Tóm tắt vai trò của các cấu trúc dữ liệu và giải thuật

6.2. Xu hướng mới và tác động trong thời đại Dữ liệu lớn

TÀI LIỆU LIÊN QUAN

THÔNG TIN CHI TIẾT

Đề tài: Ch03 To Chuc Du Lieu