С учетом кода:
struct s1 {unsigned short x;};
struct s2 {unsigned short x;};
union s1s2 { struct s1 v1; struct s2 v2; };
static int read_s1x(struct s1 *p) { return p->x; }
static void write_s2x(struct s2 *p, int v) { p->x=v;}
int test(union s1s2 *p1, union s1s2 *p2, union s1s2 *p3)
{
if (read_s1x(&p1->v1))
{
unsigned short temp;
temp = p3->v1.x;
p3->v2.x = temp;
write_s2x(&p2->v2,1234);
temp = p3->v2.x;
p3->v1.x = temp;
}
return read_s1x(&p1->v1);
}
int test2(int x)
{
union s1s2 q[2];
q->v1.x = 4321;
return test(q,q+x,q+x);
}
#include <stdio.h>
int main(void)
{
printf("%d\n",test2(0));
}
Во всей программе существует один объект объединения - q
. Его активный член установлен на v1
, а затем на v2
, а затем на v1
снова. Код использует только адрес-оператора на q.v1
или результирующий указатель, когда этот элемент активен, а также q.v2
. Поскольку p1
, p2
и p3
являются одинаковыми, для доступа к p1->v1
и p3->v2
для доступа к p2->v2
должно быть совершенно легально использовать p3->v1
.
Я не вижу ничего, что могло бы оправдать компилятор, неспособный вывести 1234, но многие компиляторы, включая clang и gcc, генерируют код, который выводит 4321. Я думаю, что происходит то, что они решают, что операции на p3 на самом деле не будут изменить содержимое любых бит в памяти, их можно просто игнорировать вообще, но я не вижу ничего в стандарте, который оправдывал бы игнорирование того факта, что p3
используется для копирования данных из p1->v1
в p2->v2
и наоборот.
Есть ли что-нибудь в стандарте, оправдывающее такое поведение, или компиляторы просто не следуют ему?