Python тип данных символ

Содержание

Типы данных в языке Python
Числовые типы (Numeric Types)
Integer
Float
Complex
Long
Логический тип (Boolean Type)
Последовательности (Sequence Type)
Строка (string)
Список (list)
Кортеж (tuple)
Диапазон (range)
Байтовые строки (bytes)
Байтовый массив (bytearray)
Буфер обмена (memoryview)
Множества (Set Types)
Множество (set)
Неизменяемое множество (frozenset)
Словарь (dict)
Изменяемые и неизменяемые типы данных
Другие встроенные типы
Символы в языке Python
Альтернатива char в Python 3
Функции
ord()
chr()
Экранирование
Подавление экранирования

Типы данных в языке Python

Говоря о типах данных, стоит упомянуть, что Python — язык с неявной сильной динамической типизацией (подробнее о видах типизации в языках программирования).

В Python типы данных можно разделить на встроенные в интерпретатор (built-in) и не встроенные, которые можно использовать при импортировании соответствующих модулей.

Стандартная реализация Python написана на C (CPython). Это означает, что каждый объект Python — это просто искусно замаскированная структура C, которая содержит не только его значение, но и другую информацию.

Каждое значение в Python имеет тип данных. Поскольку в Python все является объектом, типы данных на самом деле являются классами, а переменные являются экземплярами (объектами) этих классов.

На аппаратном уровне переменная — это ссылка на место в памяти.

Числовые типы (Numeric Types)

Существует три базовых числовых типа: int , float , complex .

Integer

int — целые числа. Отрицательные и положительные числа любой длины (ограничением является только количество памяти).

Float

float — числа с плавающей точкой, отрицательные или положительные, содержащие десятичную точку или символ экспоненты e (показатель возведения в степень 10: 35e3 , 12E4 ). Точность до 15 знаков после запятой.

float может принимать значения nan и inf / -inf .

Complex

complex — комплексные числа ( x+yj , где x — действительная часть, y — мнимая часть, а j — мнимая единица).

Long

long — использовался для представления больших целых чисел.

Кроме того, boolean является подтипом int .

Логический тип (Boolean Type)

В булевом типе данных есть только два типа значений: True и False (встроенные константы чувствительные к регистру).

Функция приведения типа bool() позволяет оценить любое значение и вернуть True или False .

В Python истинными и ложными значениями считаются не только True и False :

Последовательности (Sequence Type)

bytes (байтовая строка)
bytearray (байтовый массив)
memoryview (специальные объекты для доступа к внутренним данным объекта через protocol buffer ).

Как и все типы данных, последовательности делятся на изменяемые (mutable) и неизменяемые (immutable).

Операции, поддерживаемые большинством последовательностей (изменяемых и неизменяемых):

hash() — единственная операция, реализованная в неизменяемых типах последовательностей и отсутствующая в изменяемых. Это позволяет использовать неизменяемые последовательности, такие как экземпляры кортежей, в качестве ключей словаря и хранить их в set и frozenset .

Операции над изменяемыми последовательностями:

Строка (string)

Cтрока ( str ) — это неизменяемая упорядоченная последовательность символов Юникода. В питоне нет символьного типа данных char , символ представляет собой строку одинарной длины. Строку можно создать различными способами:

Для строк доступны общие операции c последовательностями, а так же дополнительные методы встроенного класса str() .

Список (list)

Список ( list ) — это изменяемая упорядоченная последовательность, обычно используемая для хранения коллекций однородных элементов. Поскольку списки индексируются, то могут содержать элементы с одинаковым значением.

Кортеж (tuple)

Кортеж ( tuple ) — это неизменяемая упорядоченная последовательность, обычно используемая для хранения коллекций разнородных элементов. Также используются в случаях, когда требуется неизменяемая последовательность однородных данных (например, использование в экземпляре set или dict ).

Кортежи, как правило, быстрее, чем списки в Python.

Диапазон (range)

Тип range представляет собой упорядоченную неизменяемую последовательность чисел и обычно используется для выполнения определенного количества раз циклов for .

Для диапазонов доступны общие операции с последовательностями, кроме конкатенации и повторения.

Проверка диапазонов range на равенство с == и != сравнивает их как последовательности.

Атрибуты start , stop и step .

Байтовые строки (bytes)

Тип данных bytes — это упорядоченная неизменяемая последовательность отдельных байтов. Синтаксис для байтовых строк в основном такой же, как и для обычных строк, за исключением того, что добавляется префикс b .

Байтовый массив (bytearray)

Bytearray объекты являются упорядоченным неизменяемым аналогом bytes .

Буфер обмена (memoryview)

Объекты memoryview позволяют коду Python получать доступ к внутренним данным объекта, который поддерживает буферный протокол, без копирования.

Множества (Set Types)

Множество — это неупорядоченный набор различных хешируемых объектов. Обычно множества используются для проверки вхождения элемента, удаления дубликатов из последовательности и вычисления математических операций, таких как пересечение, объединение, разность и т. д.

Будучи неупорядоченной коллекцией, множества не сохраняют положение элемента или порядок вставки. Соответственно, не поддерживают индексы, срезы или другое поведение, подобное упорядоченной последовательности.

Существует два встроенных типа множеств: set и frozenset .

Множество (set)

Тип set является изменяемым множеством, содержимое может быть изменено с помощью таких методов, как add() и remove() , так же поддерживает операции доступные frozenset . Поскольку тип set является изменяемым, он не имеет хеш-значения и не может использоваться ни как ключ словаря, ни как элемент другого множества.

Неизменяемое множество (frozenset)

Тип frozenset является неизменяемым и хешируемым множеством, его содержимое не может быть изменено после его создания, поэтому он может использоваться как ключ словаря или как элемент другого множества.

Словарь (dict)

Словарь ( dict ) — это упорядоченная, изменяемая коллекция пар ключ: значение, в которой не допускается дублирование ключей.

Ключи словаря — это произвольные, неизменяемые (хешируемые) значения.
Значения элементов словаря могут иметь любой тип данных.

Словари стали упорядоченными.

Словари и объекты представления словаря dict.keys() , dict.values() , dict.items() теперь обратимы.

Словарь может быть создан несколькими способами:

В других языках программирования тип данных подобный словарю может называться ассоциативный массив, хеш или хеш-таблица.

Изменяемые и неизменяемые типы данных

В Python существуют изменяемые и неизменяемые типы.

Неизменяемые: int , float , complex , bool , tuple , str , frozenset .

Изменяемые: list , set , dict .

При создании переменной, вначале создается объект, который имеет уникальный идентификатор, тип и значение, после этого переменная может ссылаться на созданный объект.

Неизменяемость типа данных означает, что созданный объект больше не изменяется. Например, если мы объявим переменную k = 15 , то будет создан объект со значением 15 , типа int и идентификатором, который можно узнать с помощью функции id() .

Объект с id = 1672501744 будет иметь значение 15 и изменить его уже нельзя.

Если тип данных изменяемый, то можно менять значение объекта. Например, создадим список [1, 2] , а потом заменим второй элемент на 3 .

Другие встроенные типы

Modules
Classes
Class Instances
Functions
Methods
Code Objects
Type Objects

The Null Object — None Этот объект возвращается функциями, которые явно не возвращают значение. Он не поддерживает специальные операции. Существует ровно один null объект с именем None (встроенное имя). type(None)() создает один и тот же сиглтон.
The Ellipsis Object — Ellipsis или . Этот объект обычно используется для срезов. Он не поддерживает специальные операции. Существует ровно один объект многоточия с именем Ellipsis (встроенное имя). type(Ellipsis)() создает сиглтон Ellipsis .
The NotImplemented Object
Internal Objects

Источник

Символы в языке Python

Тип char – это тип данных, служащий для хранения одиночных символов в различных кодировках.

Он широко используется в более низкоуровневых языках программирования, таких как C. Даже строки там являются массивами, состоящими из элементов типа char.

В Python нет отдельного типа для символов. Даже если присвоить переменной значение ‘а’, она будет иметь строковый тип.

Альтернатива char в Python 3

Разработчики языка решили, что нет необходимости выделять под отдельные символы целый тип. На то есть несколько причин:

Строковый тип предоставляет программисту весь нужный функционал для работы как со строками, так и с символами.
Python – язык с динамической типизацией, разделение на строковый и символьный тип добавило бы дополнительных проблем с реализацией автоматического определения типов.

Поэтому как бы программист ни пытался, переменные будут иметь строковый тип:

s = ‘Hello’ s = s[0] # Присваиваем переменной элемент ‘H’ print(type(s))

Любой символ в Python является единичной строкой, что позволяет использовать для работы с ним те же функции, что и для строк.

Строка — это неизменяемая последовательность, а так как символ тоже строка, то при попытке изменить его, возбудится исключение:

s = 'О' s[0] = 'А' # Исключение TypeError

Функции

Несмотря на объединение двух типов, язык программирования Python 3 имеет функции для работы именно с символами.

ord()

Функция возвращает числовое представление символа, переданного в качестве аргумента. То есть с её помощью в Python можно определить код символа (аналогичная функция есть и в C для приведения char к int), например:

Функция работает, только если в качестве аргумента передан один символ, при попытке передать строку возбудится исключение TypeError. С её помощью можно получить числовое представление любого символа кодировки Юникод.

chr()

Функция возвращает символ, соответствующий его числовому представлению, которое передается в качестве аргумента:

В качестве аргумента можно передать любое целое неотрицательное число вплоть до 1114111. В противном случае возбудится исключение ValueError.

Экранирование

Экранированные символы — это специальные символы после обратной косой черты «\», выполняющие определенные действия и преобразования.

Экранированная последовательность	Функция
\n	Переход на новую строку
\t	Табуляция
\r	Возврат каретки в начало строки
\x	Числа в шестнадцатеричном представлении
\o	Числа в восьмеричном представлении
\0	Нулевой символ
\’	Апостроф
\»	Двойная кавычка
\\	Обратный слэш

Экранированные символы также называются escape-последовательностями, с их помощью можно, например, форматировать строки —

s = "Привет,\n\"Сергей\"" print(s) #Выведет: Привет, "Сергей"

Подавление экранирования

Иногда программисту нужно, чтобы обратный слеш не превращал элементы в escape-последовательности, например, при работе с путями к файлам. Для этого необходимо использовать сразу две косых черты: «C:\\Users\\Public».

Когда программист хочет использовать обратный слеш для вывода, но не подавляет экранирование, в некоторых случаях даже возбуждается исключение. В следующем примере есть синтаксическая ошибка из-за того, что с «\U» начинается записть 32-битного символа Юникода (с «\u» — 16-битного). После него должна быть последовательность из 8 цифр, поэтому возникла ошибка:

s = "C:\Users\Public" SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape

Чтобы избежать этого, используют приём подавления экранирования:

s = r"C:\Users\Public" print(s) C:\Users\Public

Подавить экранирование можно с помощью «r», который ставится перед началом строки (до кавычек). На самом деле интерпретатор, видя перед строкой «r», автоматически дублирует каждый символ обратного слеша. Если использовать это в интерактивном режиме, мы увидим:

>>> s = r"C:\Users\Public" >>> s 'C:\\Users\\Public'

Строка, в которой подавляется экранирование, не может оканчиваться символом обратного слеша. В противном случае интерпретатор возбудит исключение SyntaxError.

Решить эту проблему можно несколькими способами:

Дублировать символы экранирования вручную.
Использовать конкатенацию: s = r»Привет,\nмир» + «\\» .

Источник